收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

推荐系统关键技术研究

任磊  
【摘要】:随着互联网的高速发展,信息技术已经从专业领域应用扩展到了人类工作和生活的各领域。形式多样的互联网信息服务和应用已渗透到人们生活的方方面面,人类社会原有的物理活动正逐渐向互联网虚拟空间活动演变。特别是社交网络、云计算和P2P应用等技术和服务形式的迅速普及,传统互联网一对多的应用模式正在过渡到多对多的web2.0应用模式,用户不仅是信息内容的使用者,同时也成为信息内容的制造者和传播者。伴随互联网信息资源规模的迅猛增长,用户要在海量信息空间中获得符合自己需求的信息也越发困难,形成了信息过载问题。学术界和业界对信息过载问题表现出了广泛的关注,开展了大量的研究和实践工作,提出了多种形式的信息个性化解决方案,以期为互联网信息服务用户提供符合其自身需求的信息。推荐系统作为一种智能个性化信息服务系统,其可借助用户建模技术对用户的长期信息需求进行描述,并根据用户模型通过一定的智能推荐策略实现有针对性的个性化信息定制。鉴于推荐系统具有用户需求驱动、主动服务和信息个性化程度高等优点,推荐系统在电子商务、在线学习和数字图书馆等领域得到了广泛应用,并已成为公认最有前途的信息个性化技术发展方向。 虽然推荐系统的研究和应用已经取得了一定的成果,但随着近几年网络用户与信息资源规模进一步增长,传统推荐算法中存在的问题逐渐暴露和放大,特别是推荐系统的稀疏性问题和概念漂移问题已成为影响推荐系统准确性的主要问题,妨碍了推荐系统的进一步推广和应用。 为了适应互联网信息服务的发展趋势,进一步提高推荐系统及其算法的推荐准确性,本文以减少稀疏性问题和概念漂移问题对推荐算法的影响为目标,对以下八个方面的内容进行了研究和讨论: (1)对互联网信息服务的发展现状进行分析,简要回顾了推荐系统的发展历史,概括总结了推荐系统研究和应用的现状,并详细分析现有推荐算法中存在的问题。 (2)对信息过载问题进行了问题定义和成因分析,在对传统信息检索和信息过滤技术进行对比研究的基础上,从用户建模、推荐策略、算法分类和算法评估等方面,对推荐系统进行全面分析和讨论。 (3)分析稀疏性问题的主要成因和表现,总结稀疏性问题直接和间接影响推荐系统的主要途径,结合现有针对稀疏性问题所进行的算法改进,给出了解决稀疏性问题的主要方法和策略。 (4)传统项目间相似度计算方法存在对公共评分的过度依赖,稀疏性问题会引起公共评分数量的明显减少,而基于少量公共评分的相似度计算将难以保证计算结果的准确性和可信度。针对稀疏性问题对相似度计算的影响,结合传统相似度计算的上述缺陷,提出了一种基于加权相似度的协作推荐算法WSBCF,该算法通过在相似度计算中引入评分重合因子,实现了对相似度计算的修正,从而提高了推荐在稀疏评分环境下的准确性。 (5)传统协作推荐的评分预测过程是一种建立在非稀疏评分矩阵上的理想化决策过程。在稀疏评分环境中,过度依赖个性化评分将引起推荐的整体准确性下降。针对稀疏性问题对评分预测过程的这一影响,结合人类在推荐服务中所表现出的从众心理,提出了一种基于平衡评分预测机制的协作推荐算法IBCFBP,该算法综合考虑个性化评分和全局评分在评分预测中的决策支持作用,通过动态调整个性化评分和全局评分在评分预测中的作用,从而完善和改进了传统评分预测过程。 (6)协作推荐算法的各执行过程都依赖于评分矩阵实现相应功能,评分矩阵的稀疏性将对整个协作推荐产生全方位的影响。针对评分矩阵稀疏性对协作推荐的影响,在推荐对象内容可解析的应用环境中,结合基于内容推荐算法对稀疏性问题的不敏感性,提出了一种基于评分填充的混合推荐算法HRRF,该算法通过采用基于内容的推荐算法,实现了对稀疏评分矩阵的个性化评分填充,提高了评分矩阵的数据密度,从而缓解了稀疏性问题的影响。 (7)分析概念漂移问题的主要成因和表现,总结概念漂移问题影响推荐算法的主要途径,结合机器学习和推荐系统领域的现有改进算法,给出了解决概念漂移问题的主要策略。 (8)针对概念漂移问题对协作推荐系统的影响,结合评分重要性随时间指数形式衰减的性质,提出了一种利用评分时间特性的协作推荐算法TIBCF,该算法利用评分时间权重同时实现了对相似度计算和评分预测两个计算过程的修正,从而缓解了概念漂移问题对协作推荐的干扰作用。 本文通过对上述研究内容的讨论,阐明了信息过载问题的产生原因和影响,全面分析了影响推荐系统发展的相关问题,特别针对稀疏性问题和概念漂移问题对协作推荐算法的影响,通过对协作推荐算法各执行过程的完善和改进,提出了相应的改进算法,并实验证明了所提算法在提高协作推荐预测准确性方面的有效性。 本文的主要贡献包括: (1)从互联网信息服务的视角阐述了信息过载问题的产生原因和影响。 (2)分析了个性化信息服务的需求,对个性化信息服务进行了形式化定义。 (3)归纳总结了推荐系统的组成结构和工作原理,分析和讨论了推荐系统涉及的用户建模、推荐算法和算法评价等内容。 (4)讨论了稀疏性问题和概念漂移问题的主要成因,以及二者影响推荐系统的途径,对比分析了现有解决方法,概括了解决二者的主要策略。 (5)针对稀疏性问题对协作推荐的影响,通过完善相似度计算、改进评分预测机制和提高评分数据密度,缓解了稀疏性问题的影响,分别提出了WSBCF、IBCFBP和HRRF算法,并通过实验证明了上述三种算法,在提高推荐准确性方面的有效性。 (6)针对概念漂移问题对协作推荐的影响,通过时间权重改进了相似度计算和评分预测过程,相应提出了TIBCF算法,并实验证明了该算法在解决概念漂移问题以及提高推荐准确性方面的有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张忠平;郭献丽;;PEV:一种新的用于Item-Based协同过滤算法的相似性度量方法[J];小型微型计算机系统;2009年04期
2 马宏伟;张光卫;李鹏;;协同过滤推荐算法综述[J];小型微型计算机系统;2009年07期
3 和博涛;李震雄;;面向电子商务的协同过滤推荐系统研究与设计[J];数字技术与应用;2011年03期
4 王卫平;杨磊;;结合最大熵模型和tag特征的混合推荐系统[J];计算机系统应用;2011年07期
5 刘勇;;基于项目相似度计算改进的协同过滤算法[J];商场现代化;2007年31期
6 曾子明;;基于Agent和CBR的电子商务推荐系统模型研究[J];现代情报;2008年03期
7 王恒;;基于协同过滤的电子农务推荐系统模型研究[J];宁夏大学学报(自然科学版);2009年04期
8 高虎明;李伟丽;;基于协同过滤和Rankboost算法的酒店推荐系统[J];微计算机信息;2010年36期
9 王卫平;赵明;刘迎意;王选;;基于智能多agent的推荐系统[J];计算机系统应用;2010年02期
10 孙小华;陈洪;孔繁胜;;在协同过滤中结合奇异值分解与最近邻方法[J];计算机应用研究;2006年09期
11 王卫平;王金辉;;基于Tag和协同过滤的混合推荐方法[J];计算机工程;2011年14期
12 张李义;罗惠恒;;基于协同过滤的WhuRecomm推荐系统的设计与实现[J];武汉大学学报(工学版);2006年06期
13 陈毅波;揭志忠;吴产乐;;基于同义标签分组的协同推荐[J];湖南大学学报(自然科学版);2011年05期
14 黄晓斌;;基于协同过滤的数字图书馆推荐系统研究[J];大学图书馆学报;2006年01期
15 杨静,高琳琦;前瞻选择抽样算法在产品推荐中的应用[J];计算机应用;2005年09期
16 游文;叶水生;;电子商务推荐系统中的协同过滤推荐[J];计算机技术与发展;2006年09期
17 王钟庄;邓伦丹;石文兵;;数据挖掘技术在电子商务推荐系统中的应用研究[J];微电子学与计算机;2007年04期
18 王晗;夏自谦;;基于蚁群算法和浏览路径的推荐算法研究[J];中国科技信息;2009年07期
19 战昱楠;;在线信誉管理系统中推荐子系统相关技术综述[J];科技信息;2009年15期
20 胡炜;;协同过滤算法在推荐系统中的应用[J];计算机时代;2009年11期
中国重要会议论文全文数据库 前10条
1 谢科;刘奕群;岑荣伟;马少平;茹立云;杨磊;;基于维基百科层次分类框架的主题推荐系统的研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 尤忠彬;陈越;张英;朱扬勇;;基于Web服务的技术转移平台推荐系统研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
3 王君;许洁萍;;层次音乐推荐系统的研究[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
4 靳绍聪;王建民;闻立杰;曹大海;;一种基于推荐系统的工作流资源分配机制[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 潘宇;林鸿飞;杨志豪;;基于用户聚类的电子商务推荐系统[A];第三届学生计算语言学研讨会论文集[C];2006年
6 何发镁;冯勇;许榕生;王旭仁;;推荐系统安全问题研究综述[A];第13届全国计算机、网络在现代科学技术领域的应用学术会议论文集[C];2007年
7 张光卫;康建初;李鹤松;刘常昱;李德毅;;面向场景的协同过滤推荐算法[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
8 王茜;张卫星;;基于分类树相似度加权的协同过滤算法[A];2008年计算机应用技术交流会论文集[C];2008年
9 赵欣;寇纲;邬文帅;卢艳群;;基于时间密集性的推荐系统攻击检测[A];第六届(2011)中国管理学年会论文摘要集[C];2011年
10 赵立江;何钦铭;;聚类分析在个性化学习中的研究与应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 任磊;推荐系统关键技术研究[D];华东师范大学;2012年
2 李涛;推荐系统中若干关键问题研究[D];南京航空航天大学;2009年
3 胡新明;基于商品属性的电子商务推荐系统研究[D];华中科技大学;2012年
4 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
5 张寅;个性化技术及其在数字图书馆中应用的研究[D];浙江大学;2009年
6 张尧;B2C环境下用户感知可信的推荐系统理论及其关键方法研究[D];哈尔滨工业大学;2013年
7 李聪;协同过滤推荐系统托攻击防御技术研究[D];国防科学技术大学;2012年
8 张亮;推荐系统中协同过滤算法若干问题的研究[D];北京邮电大学;2009年
9 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
10 陈根浪;基于社交媒体的推荐技术若干问题研究[D];浙江大学;2012年
中国硕士学位论文全文数据库 前10条
1 章晋波;推荐系统中协同过滤算法的研究与实现[D];北京邮电大学;2010年
2 闫祥雨;基于语义Web技术的推荐系统研究[D];太原理工大学;2010年
3 寇艳艳;电子商务推荐系统中用户聚类问题与用户兴趣变化问题研究[D];中国科学技术大学;2011年
4 李惠民;电子商务推荐系统中协同过滤算法的研究[D];吉林大学;2011年
5 王昆;一种基于Bayesian CBR的推荐系统研究[D];河北师范大学;2011年
6 何克勤;基于标签的推荐系统模型及算法研究[D];华东师范大学;2011年
7 林源;英文短文本相似性研究及在图书推荐中的应用[D];北京林业大学;2010年
8 林佳雄;关联规则挖掘在电子商务推荐系统中的应用研究[D];暨南大学;2011年
9 王霞;协同过滤在电子商务推荐系统中的应用研究[D];河海大学;2003年
10 段利君;基于Web挖掘的网页动态推荐系统研究[D];复旦大学;2010年
中国重要报纸全文数据库 前10条
1 本报记者 冯卫东;网络导购:找出你的最爱[N];科技日报;2007年
2 林嘉澍;从搜索到发现[N];经济观察报;2007年
3 饶宇锋;微软策动互联网跨越搜索时代[N];财经时报;2007年
4 熊明华;九江人才市场打造就业“助推器”[N];中国人事报;2006年
5 镡立勇;2007年度省科技奖推荐工作启动[N];河北经济日报;2007年
6 本报记者  何小龙;委员履职:量化打分[N];江淮时报;2006年
7 薛求知;我们需要准确地理解西点军校[N];上海证券报;2007年
8 CPW华南区记者 伍羡妮;开放平台 移动商务乍现商机[N];电脑商报;2003年
9 记者 温跃通讯员 朱锋 朱沙;农行山东省分行与省教育厅全面合作[N];金融时报;2007年
10 孙海冰 王海波 丁玉萍;打造科技创新的助推器和风向标[N];东营日报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978