收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于机器学习的信息过滤和信息检索的模型和算法研究

张亮  
【摘要】: 随着Internet技术的飞速发展,信息网络在人们的工作生活中具有越来越重要的地位。从网络上的海量信息中快速、高效地获取人们真正需要的信息资源,已成为信息社会中的一个关键问题。信息过滤和信息检索技术是解决这一问题的有效方法,具有重要的学术意义和应用价值。本文基于统计机器学习方法,重点研究了信息过滤和信息检索模型与求解算法。主要研究内容包括: 首先,介绍了信息过滤和信息检索的概念和意义,总结了它们的起步和发展情况。概括介绍了几种基于统计的机器学习方法的概念和特点以及它们在信息过滤和信息检索中的应用,作为本文的理论基础。 其次,介绍了协同过滤问题的几种常见方法,提出了应用于协同过滤的一种概率模型,称为真实偏好高斯混合模型。新模型引入了两个隐含变量,分别用于描述用户类和项目类,用户和项目依概率可以同时属于多个类中。模型中考虑了用户评分习惯以及项目的公众评价对用户-项目最终评价的综合影响。与传统协同过滤模型相比,新模型更符合用户评价的实际情况。 第三,研究了有限混合模型在大规模文本数据聚类问题中的应用,提出了用有限混合模型进行无监督文本聚类的一种规范的广义方法。它将模型选择,特征选择以及混合模型的参数估计纳入一个统一的框架。定义了一种改进的“特征显著性”方法,将特征对各混合成员的相关性作为隐变量引入混合模型,在估计模型参数的同时完成特征选择。发展了一种带特征选择的多项式混合模型,作为广义方法的实例做了详细的说明。 第四,采用基于图的方法研究半监督学习问题。主要思想是定义样本间基于密度距离的相似度,得到数据集的内在结构信息,并将其引入学习器加以利用。对半监督分类,定义了一种基于密度的距离来反映数据点间的相似度,在此基础上以一种Laplacian核方法来构造整个特征空间上的超分类面。对半监督聚类问题,提出了一种基于密度的约束扩展方法。根据样本点间基于密度的距离和相似度关系,对已知约束集进行扩展,扩展后的约束集包含了数据集的内在结构信息。 最后,对论文的主要研究工作进行总结,展望了今后的研究前景。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王志军;岳训;付冬菊;苗良;;基于Web投票机制的免疫协同过滤推荐技术研究[J];农业网络信息;2010年01期
2 顾晔;吕红兵;;改进的增量奇异值分解协同过滤算法[J];计算机工程与应用;2011年11期
3 许海玲;吴潇;李晓东;阎保平;;互联网推荐系统比较研究[J];软件学报;2009年02期
4 李聪;梁昌勇;;适应用户兴趣变化的协同过滤增量更新机制[J];情报学报;2010年01期
5 杨帆;姜建国;;基于客户偏好的页面隐式电子商务推荐技术探究[J];电脑知识与技术;2008年11期
6 徐翔;王煦法;;协同过滤算法中的相似度优化方法[J];计算机工程;2010年06期
7 李超然,徐雁斐,张亮;协同推荐pLSA模型的动态修正[J];计算机工程;2005年20期
8 杨风召;;一种基于特征表的协同过滤算法[J];计算机工程与应用;2007年06期
9 李涛;王建东;叶飞跃;;推荐系统中一种新的相似性计算方法[J];计算机科学;2007年08期
10 马丽;;基于群体兴趣偏向度的数字图书馆协同过滤技术研究[J];现代图书情报技术;2007年10期
11 武建伟;俞晓红;陈文清;;基于密度的动态协同过滤图书推荐算法[J];计算机应用研究;2010年08期
12 姜丽红;徐博艺;席俊红;;基于案例推理的过滤算法及智能信息推荐系统[J];清华大学学报(自然科学版);2006年S1期
13 余小鹏;;一种基于多层关联规则的推荐算法研究[J];计算机应用;2007年06期
14 沈磊;周一民;李舟军;;基于心理学模型的协同过滤推荐方法[J];计算机工程;2010年20期
15 何光辉;魏曙光;王蔚韬;;改进的聚类邻居协同过滤推荐算法[J];计算机科学;2004年11期
16 苏一丹;王育才;顾新一;;基于独特型人工免疫网络的并行推荐算法的研究[J];计算机应用;2008年05期
17 李珊;何建敏;厉浩;;基于知识的协同过滤推荐系统研究[J];情报学报;2008年03期
18 陈逸;于洪;;一种基于相同评分矩阵的协同过滤补值算法[J];计算机应用研究;2009年12期
19 顾申华;;结合奇异值分解和时间权重的协同过滤算法[J];计算机应用与软件;2010年06期
20 李益群;张文生;杨柳;刘琰琼;;基于标签的强化学习推荐算法研究与应用[J];计算机应用研究;2010年08期
中国重要会议论文全文数据库 前10条
1 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
3 陶红亮;王明文;曹瑛;;基于项目平滑和聚类的协同过滤推荐算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
4 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
5 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
6 李雪;左万利;赫枫龄;王英;;传统Item-Based协同过滤推荐算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
7 娄冬梅;陈明;朱有娜;;一种基于密度的无参数聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
8 梁一平;邓左祥;周小平;;一种多关系数据挖掘中元组ID传播的设计与实现[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
9 张琦;乔卫勇;;RACF介绍[A];第二次计算机安全技术交流会论文集[C];1987年
10 周晓云;孙志挥;张柏礼;胡文瑜;;一种基于单调递减阈值函数的高维数据集聚类算法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国博士学位论文全文数据库 前10条
1 张亮;基于机器学习的信息过滤和信息检索的模型和算法研究[D];天津大学;2007年
2 沈磊;心理学模型与协同过滤集成的算法研究[D];北京航空航天大学;2010年
3 夏培勇;个性化推荐技术中的协同过滤算法研究[D];中国海洋大学;2011年
4 高旻;基于计算语用学和项目的资源协同过滤推荐研究[D];重庆大学;2010年
5 吴俊;视像概念检测中在线学习算法研究[D];清华大学;2008年
6 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年
7 孙慧峰;基于协同过滤的个性化Web推荐[D];北京邮电大学;2012年
8 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
9 李斌;概率混合模型的研究及其应用[D];复旦大学;2009年
10 谢琪;基于协同过滤与QoS的个性化Web服务推荐研究[D];重庆大学;2012年
中国硕士学位论文全文数据库 前10条
1 曾小波;基于协同过滤的推荐系统的研究[D];电子科技大学;2010年
2 金亚亚;一种基于改进信任度的协同过滤算法[D];华东理工大学;2011年
3 邵伟;基于领域知识的协同过滤推荐研究[D];河北大学;2010年
4 胡福华;基于可信相似度传递的协同过滤算法研究与应用[D];浙江大学;2011年
5 李高敏;基于协同过滤的教学资源个性化推荐技术的研究及应用[D];北京交通大学;2011年
6 张晓蕾;协同过滤推荐模型及其在汽车电子商务中的应用研究[D];天津师范大学;2010年
7 王均波;协同过滤推荐算法及其改进研究[D];重庆大学;2010年
8 白龙;融合数据检测与用户信任的协同过滤算法研究[D];燕山大学;2010年
9 康雨洁;基于协同过滤的个性化社区推荐方法研究[D];中国科学技术大学;2011年
10 庞军;双聚类算法及其在协同过滤中的应用研究[D];大连理工大学;2010年
中国重要报纸全文数据库 前10条
1 山水;艾斯本与NIST集合数据集[N];中国石化报;2007年
2 记者 刘浪 通讯员 廖雅琴;中国首套数字化“可视人”数据集在渝通过成果鉴定[N];重庆日报;2003年
3 秦笃烈;解读 中国造女性数字人[N];健康报;2006年
4 李宇;上市预披露将成市场常规[N];中国证券报;2008年
5 郭立;荣昌猪实现数字化[N];中国畜牧兽医报;2005年
6 上海 陈纯;初识T-SQL,恋情的开始[N];电脑报;2004年
7 李宇;港交所明年试验上市预披露计划[N];中国证券报;2007年
8 周青 编译;CDP:与快照相得益彰[N];计算机世界;2006年
9 本报记者 周仲全 实习生 蔡为伟;数字虚拟人:为承受人类苦痛而来[N];辽宁日报;2005年
10 本报记者  郝宗强;为社会和谐作贡献[N];人民日报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978