收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

电子商务推荐系统中协同过滤瓶颈问题研究

李聪  
【摘要】: 随着Internet和电子商务的迅猛发展,人类已经进入信息社会时代。我国的电子商务市场发展潜力巨大,同时保持了持续高速增长势头。人们通过访问电子商务网站,可以享受足不出户选购商品的快乐和方便。但是,电子商务网站提供的大量商品对用户造成了“信息超载”,导致电子商务网站面临这样一个严峻的问题:如何在用户浏览网站时将适合该用户的商品推荐到他/她面前,克服信息超载带来的不利影响,从而促成更多的交易以增加企业销售额? 电子商务推荐系统(E-commerce recommender systems)就是解决信息超载问题的一种方案、一种实现电子商务网站“一对一营销”战略的技术,可作为网站客户关系管理的有益组成部分,已经在许多大型网站得到应用。协同过滤是目前电子商务推荐系统中广泛使用的、最成功的推荐算法,但还存在诸如稀疏性(sparsity)、冷启动(cold-start)、可扩展性(scalability)等制约其进一步发展的瓶颈问题。因此,需要对上述协同过滤瓶颈问题展开进一步研究。本文的主要研究内容如下: (1)对协同过滤的国内外研究现状进行了全面的梳理和综述,在此基础上对协同过滤瓶颈问题进行了提炼。 (2)针对基于项目评分预测的协同过滤推荐算法在缓解稀疏性问题上的不足,即目标用户最近邻搜寻不够准确和存在不必要计算耗费,首先提出了非目标用户类型区分理论,从而将用户评分项并集中的非目标用户区分为无推荐能力和有推荐能力两种类型。对于无推荐能力用户,不再计算其与目标用户的相似性以提高算法效率和改善推荐实时性;对于有推荐能力用户,则在其与目标用户存在共同评分项类时,提出了领域最近邻理论对用户评分项并集中的未评分项进行评分预测,从而使最近邻搜寻更加准确。为了防止用户评分数据的极端稀疏现象可能导致领域最近邻的用户相似性过低,进一步提出了一种基于Rough集理论的用户评分项并集未评分值填补方法,该方法能有效实现用户评分项并集的完备化,从而将其应用于评分矩阵的未评分值估算以缓解稀疏性,实现了对领域最近邻理论的有效补充。 (3)针对冷启动中的新用户问题,提出了一种冷启动消除方法。首先,提出了用户访问项序理论,通过Web日志来获取用户访问项序,并定义了n序访问解析逻辑,将用户访问项序分解为用户访问子序集,并设计了用户访问项序的相似性计算方法来搜寻新用户的最近邻集合,进而提出了一种改进的最频繁项提取算法IMIEA来对最近邻集合的用户访问项序进行处理,得到面向新用户的top-N推荐;基于最近邻用户与新用户的用户访问项序集合,建立了用户访问项序的Markov链模型,实现了对新用户的商品导航推荐。 (4)针对可扩展性问题,提出了一种适应用户兴趣变化的协同过滤增量更新机制,能够以较小的系统计算量在用户提交新评分后实时更新相应项目与其它项目之间的相似性数据,从而消除了传统方法在每次进行推荐计算时无法避免的扫描全体项目空间的计算耗费,有效改善了可扩展性;同时,由于这种增量更新机制保证了在推荐运算中能够使用到最新的用户评分数据,因此使得推荐服务可以适应用户兴趣偏好的动态变化,从而弥补了传统的离线计算项目相似性方法难以反映用户兴趣漂移的不足。 (5)在本文提出的上述理论和方法基础上,设计并实现了一个电子商务协同过滤原型系统ECRec(E-Commerce Recommender system),该系统具有良好的可移植性、可维护性及开放式架构(open architecture)特征。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李聪;梁昌勇;杨善林;;电子商务协同过滤稀疏性研究:一个分类视角[J];管理工程学报;2011年01期
2 王卫平;杨磊;;结合最大熵模型和tag特征的混合推荐系统[J];计算机系统应用;2011年07期
3 孙小华;陈洪;孔繁胜;;在协同过滤中结合奇异值分解与最近邻方法[J];计算机应用研究;2006年09期
4 王静蕾;高继勋;;电子商务环境中个性化信息推荐服务的发展[J];河南工程学院学报(自然科学版);2008年02期
5 张海鹏;李烈彪;李仙;周亚蜂;;基于项目分类预测的协同过滤推荐算法[J];情报学报;2008年02期
6 吴昊;宋伟国;程亚娟;;基于CF面向对象的电子商务推荐系统[J];甘肃科学学报;2011年01期
7 傅鹤岗;彭晋;;基于模范用户的改进协同过滤算法[J];计算机工程;2011年03期
8 郭艳红;邓贵仕;;协同过滤系统项目冷启动的混合推荐算法[J];计算机工程;2008年23期
9 陈逸;于洪;;一种基于相同评分矩阵的协同过滤补值算法[J];计算机应用研究;2009年12期
10 刘淇;陈恩红;;结合二部图投影与排序的协同过滤[J];小型微型计算机系统;2010年05期
11 龚松杰;潘红艳;;基于领域本体的协同过滤推荐算法[J];计算机系统应用;2008年05期
12 李聪;;电子商务协同过滤可扩展性研究综述[J];现代图书情报技术;2010年11期
13 陈志敏;李志强;;基于用户特征和项目属性的协同过滤推荐算法[J];计算机应用;2011年07期
14 王卫平;王金辉;;基于Tag和协同过滤的混合推荐方法[J];计算机工程;2011年14期
15 李聪;梁昌勇;;适应用户兴趣变化的协同过滤增量更新机制[J];情报学报;2010年01期
16 张李义;罗惠恒;;基于协同过滤的WhuRecomm推荐系统的设计与实现[J];武汉大学学报(工学版);2006年06期
17 王恒;;基于协同过滤的电子农务推荐系统模型研究[J];宁夏大学学报(自然科学版);2009年04期
18 吴春旭;李佳俊;石辉;;一种基于分众分类的协同过滤推荐算法[J];计算机系统应用;2010年05期
19 张巍,刘鲁,葛健;一种基于粗集的协同过滤算法[J];小型微型计算机系统;2005年11期
20 温会平;陈俊杰;;基于用户模糊聚类的个性化推荐算法[J];计算机与数字工程;2008年02期
中国重要会议论文全文数据库 前10条
1 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
2 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
4 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
5 汤显;郭景峰;高英飞;;基于类别相似性的增量协同过滤推荐算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
6 陶红亮;王明文;曹瑛;;基于项目平滑和聚类的协同过滤推荐算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
8 李雪;左万利;赫枫龄;王英;;传统Item-Based协同过滤推荐算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 聂智军;王宝园;;基于分区策略的RANS方程并行算法可扩展性分析[A];计算流体力学研究进展——第十二届全国计算流体力学会议论文集[C];2004年
10 李芳;边馥苓;;构件化GIS的可扩展性研究[A];第四届海峡两岸GIS发展研讨会暨中国GIS协会第十届年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年
2 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
3 夏培勇;个性化推荐技术中的协同过滤算法研究[D];中国海洋大学;2011年
4 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年
5 郭艳红;推荐系统的协同过滤算法与应用研究[D];大连理工大学;2008年
6 沈磊;心理学模型与协同过滤集成的算法研究[D];北京航空航天大学;2010年
7 高旻;基于计算语用学和项目的资源协同过滤推荐研究[D];重庆大学;2010年
8 王之元;并行计算可扩展性分析与优化[D];国防科学技术大学;2011年
9 李景涛;P2P环境下的信任模型与副本方案研究[D];复旦大学;2006年
10 王林;间歇精馏冷启动过程的流程模拟[D];浙江大学;2002年
中国硕士学位论文全文数据库 前10条
1 袁先虎;基于混合用户模型的协同过滤推荐算法研究[D];重庆大学;2010年
2 邵伟;基于领域知识的协同过滤推荐研究[D];河北大学;2010年
3 张晓蕾;协同过滤推荐模型及其在汽车电子商务中的应用研究[D];天津师范大学;2010年
4 康雨洁;基于协同过滤的个性化社区推荐方法研究[D];中国科学技术大学;2011年
5 庞军;双聚类算法及其在协同过滤中的应用研究[D];大连理工大学;2010年
6 曾小波;基于协同过滤的推荐系统的研究[D];电子科技大学;2010年
7 李春;协同过滤推荐算法的研究[D];湘潭大学;2010年
8 金亚亚;一种基于改进信任度的协同过滤算法[D];华东理工大学;2011年
9 胡福华;基于可信相似度传递的协同过滤算法研究与应用[D];浙江大学;2011年
10 王均波;协同过滤推荐算法及其改进研究[D];重庆大学;2010年
中国重要报纸全文数据库 前10条
1 丁皓;印陆军“冷启动”新作战理论[N];中国国防报;2004年
2 ;EtherScale结构——弹性、可扩展性和安全性的保证[N];网络世界;2004年
3 博瑞祥弘;常见冷启动故障分析[N];中国消费者报;2005年
4 郭振海;冷启动后发动机为什么抖动?[N];中国交通报;2002年
5 叶莲;印陆军要买1000辆T-90S坦克[N];中国国防报;2008年
6 北雪;3月空调市场冷启动[N];中国经营报;2003年
7 郑建国;现代索纳塔轿车 冷启动困难[N];中国汽车报;2001年
8 何宝宏;IPTV与P2P技术结合将更具可扩展性[N];中国电子报;2007年
9 王涛;印陆军演练核条件下奔袭作战[N];中国国防报;2007年
10 中国软件评测中心媒体测试部;设计出众 可扩展性优秀[N];中国计算机报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978