收藏本站
《中国海洋大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

个性化推荐技术中的协同过滤算法研究

夏培勇  
【摘要】:随着网络与信息技术的飞速发展,互联网为用户提供越来越多的信息和服务,用户在得到便利的同时也不得不面临大量的垃圾信息和无意义数据,即所谓的信息超载问题。面对海量的网络资源,个性化推荐系统能够及时跟踪用户的需求变化来自动调整信息服务的方式和内容,是一种极具潜力的解决信息超载的服务技术。 协同过滤技术是目前推荐系统中最成功和应用最广泛的技术,在理论研究和实践中都取得了快速的发展,它根据用户的历史选择信息和相似性关系,收集与用户兴趣爱好相同的其他用户的评价信息来产生推荐。然而,传统的协同过滤算法面临数据稀疏、用户相似性难以度量、实时性和可扩展性差等方面的挑战,影响了推荐系统的质量。本文针对这些问题,对协同过滤算法进行了相应的改进,主要工作如下: 1)针对传统相似性度量方法在用户数据稀疏和小邻居集下度量不准确问题,提出了一种基于信息熵的相似性度量方法。该算法首先计算用户间评分的差异,而后通过该差异的加权信息熵来衡量用户评分的相似程度;同时在计算用户相似度时还考虑用户间共同关注圈的大小,用户关注圈交集越大,相似性权重越大。实验结果表明,在数据稀疏程度不变的情况下,该相似性度量方法缓解了传统方案在稀疏数据和小邻居集下的相似度度量不准确问题,提高了推荐的精度。 2)针对传统的协同过滤技术在产生推荐时只考虑用户-项目评分信息而易受数据稀疏影响的问题,引入项目属性信息,提出了一种基于评分相似性和项目属性相似性的混合协同过滤算法。首先,通过项目属性信息设计了一种基于项目属性偏好的用户相似性度量方法,该方法符合用户间的真实关系,同时也能够有效地缓解用户评分稀疏的问题。而后在衡量用户相似性时,综合考虑用户评分的相似性和用户对项目属性偏好的相似性,并通过一个权值w来控制两者的重要程度;实验结果表明,在不同稀疏程度的数据上,该算法获得了比传统相似性计算方法更好的推荐精度,且数据越稀疏性能提升越明显。 3)针对基于内存的协同过滤算法在线计算量较大且可扩展性较低的缺点,提出了一种基于SVD矩阵填充技术的K-means聚类协同过滤算法。传统的基于聚类的协同过滤算法由于数据的高维稀疏往往预测精度非常低,因此,本算法首先利用SVD降维策略提高数据密度,得到一个没有缺失值的评分矩阵,而后利用K-means聚类在填充完整的数据上对用户进行聚类,从而对完成对测试集上未知评分进行预测。该算法利用用户与项目之间的潜在关系克服了稀疏性问题,同时保留了聚类方法实时性好、可扩展性强的优点。实验结果表明,相对于传统的Pearson协同过滤,基于SVD协同过滤和基于K-means的协同过滤,该算法获得了更好的预测性能,同时具有良好的可扩展性。 4)针对单个模型做协同过滤推荐时精度较低的问题,提出了一种改进的自适应AdaBoot.RT集成学习算法,首先利用梯度下降法最小化用户评分的误差函数来构造基类弱回归算法,而后利用一种改进的AdaBoost.RT集成学习方法进行建模。在改进的AdaBoost.RT算法中,用一种带统计特性的偏差系数α来代替原算法中的相对误差参数φ,α能够根据预测误差的情况进行自适应调整,从而使样本权重的调整更加符合预测结果。实验结果表明,该集成学习算法能够显著地提高单个模型的推荐精度。
【学位授予单位】:中国海洋大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP391.3

【引证文献】
中国期刊全文数据库 前2条
1 刘文龙;张桂芸;陈喆;朱蔷蔷;;基于加权信息熵相似性的协同过滤算法[J];郑州大学学报(工学版);2012年05期
2 刘平峰;朱孔真;聂规划;;中文数字家庭语义词典的构建与应用研究[J];武汉理工大学学报(信息与管理工程版);2013年02期
中国硕士学位论文全文数据库 前4条
1 韩李侠;网络资源个性化推荐技术研究及应用[D];西北大学;2012年
2 张进;电子商务推荐系统中协同过滤算法的分析与研究[D];首都经济贸易大学;2012年
3 朱萍;楼宇电子商务平台的设计与实现[D];浙江工业大学;2012年
4 段小康;基于用户信息的个性化图书推荐[D];华南理工大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 孙多;;基于兴趣度的聚类协同过滤推荐系统的设计[J];安徽大学学报(自然科学版);2007年05期
2 崔林,宋瀚涛,陆玉昌;基于语义相似性的资源协同过滤技术研究[J];北京理工大学学报;2005年05期
3 张锋;常会友;;使用BP神经网络缓解协同过滤推荐算法的稀疏性问题[J];计算机研究与发展;2006年04期
4 谢芳;王波;;基于关联规则个性化推荐的改进算法[J];计算机应用;2006年S2期
5 王辉;高利军;王听忠;;个性化服务中基于用户聚类的协同过滤推荐[J];计算机应用;2007年05期
6 张海燕,丁峰,姜丽红;基于模糊聚类的协同过滤推荐方法[J];计算机仿真;2005年08期
7 邓爱林,朱扬勇,施伯乐;基于项目评分预测的协同过滤推荐算法[J];软件学报;2003年09期
8 张光卫;李德毅;李鹏;康建初;陈桂生;;基于云模型的协同过滤推荐算法[J];软件学报;2007年10期
9 吴湖;王永吉;王哲;王秀利;杜栓柱;;两阶段联合聚类协同过滤算法[J];软件学报;2010年05期
10 高凤荣,杜小勇,王珊;一种基于稀疏矩阵划分的个性化推荐算法[J];微电子学与计算机;2004年02期
中国博士学位论文全文数据库 前1条
1 郁雪;基于协同过滤技术的推荐方法研究[D];天津大学;2009年
中国硕士学位论文全文数据库 前2条
1 葛润霞;基于内容聚类的协同过滤推荐系统研究[D];山东师范大学;2008年
2 姜百宁;机器学习中的特征选择算法研究[D];中国海洋大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 孙多;;基于兴趣度的聚类协同过滤推荐系统的设计[J];安徽大学学报(自然科学版);2007年05期
2 龚书;瞿有利;田盛丰;;基于语义的自动文摘研究综述[J];北京交通大学学报;2009年05期
3 张小平;周雪忠;黄厚宽;冯奇;陈世波;焦宏官;;一种改进的LDA主题模型[J];北京交通大学学报;2010年02期
4 冀俊忠,沙志强,刘椿年,郎青;B2C电子商务站点中知识发现的研究[J];北京工业大学学报;2003年02期
5 罗森林;李金玉;潘丽敏;;特定类型音频流泛化识别方法[J];北京理工大学学报;2011年10期
6 明均仁;张帆;;网络文本信息过滤的意义及其模型初探[J];图书与情报;2007年04期
7 裘立波;姜元春;林文龙;;电子商务环境下捆绑商品研究[J];商业研究;2009年09期
8 高灵渲;张巍;霍颖翔;滕少华;;改进的聚类模式过滤推荐算法[J];江西师范大学学报(自然科学版);2012年01期
9 李大学;谢名亮;赵学斌;;结合项目类别信息的协同过滤推荐算法[J];重庆邮电大学学报(自然科学版);2010年06期
10 纪良浩;;协作过滤信息推荐技术研究[J];重庆邮电大学学报(自然科学版);2012年01期
中国重要会议论文全文数据库 前10条
1 孙衢;王永玉;;基于云模型的非线性系统智能滑模控制[A];第二十九届中国控制会议论文集[C];2010年
2 王茜;张卫星;;基于分类树相似度加权的协同过滤算法[A];2008年计算机应用技术交流会论文集[C];2008年
3 李扬;陈超;祁麟;俞能海;;一种基于用户行为相似度的协同推荐算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
4 戴丽金;何振峰;;基于云模型的时间序列相似性度量方法[A];第八届中国不确定系统年会论文集[C];2010年
5 赵琦;骆志刚;田文颖;李聪;丁凡;;一种基于负反馈信息的用户兴趣模型修正方法[A];中国通信学会第六届学术年会论文集(下)[C];2009年
6 林丽冰;师瑞峰;周一民;李月雷;;基于双聚类的协同过滤推荐算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
7 庄连生;唐克坦;马启荣;俞能海;;基于注意力模型的PLSA目标学习算法[A];第十四届全国图象图形学学术会议论文集[C];2008年
8 梁莘燊;刘莹;;基于效能的学术资源推荐算法研究[A];第六届(2011)中国管理学年会——信息管理分会场论文集[C];2011年
9 潘宇;林鸿飞;杨志豪;;基于用户聚类的电子商务推荐系统[A];第三届学生计算语言学研讨会论文集[C];2006年
10 王明文;陶红亮;熊小勇;;双向聚类迭代的协同过滤推荐算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
2 张寅;个性化技术及其在数字图书馆中应用的研究[D];浙江大学;2009年
3 黄正行;临床过程分析与优化技术研究[D];浙江大学;2010年
4 江悦;场景图像内容表述和分类研究[D];国防科学技术大学;2010年
5 齐峰;人工神经树网络模型的优化研究与应用[D];山东师范大学;2011年
6 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
7 张小平;主题模型及其在中医临床诊疗中的应用研究[D];北京交通大学;2011年
8 王中锋;树型贝叶斯网络分类器鉴别式训练研究[D];北京交通大学;2011年
9 蔺源;基于用户行为的网格资源发现相关问题研究[D];北京交通大学;2011年
10 靳延安;社会标签推荐技术与方法研究[D];华中科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 蔡宏果;基于基因表达式编程的Web个性化推荐技术研究[D];广西师范学院;2010年
2 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
3 娄铮铮;sIB算法在图像无监督分类中的应用研究[D];郑州大学;2010年
4 何莹杰;个性化图书信息服务技术研究[D];哈尔滨工程大学;2010年
5 刘佳荟;基于信任度量的网构软件动态演化研究[D];哈尔滨工程大学;2010年
6 李媛;电子商务个性化推荐关键技术研究[D];哈尔滨工程大学;2010年
7 赵八一;基于概率图模型的图像分类和注释[D];大连理工大学;2010年
8 庞军;双聚类算法及其在协同过滤中的应用研究[D];大连理工大学;2010年
9 冯元佶;基于图的半监督学习的改进研究[D];湘潭大学;2010年
10 李春;协同过滤推荐算法的研究[D];湘潭大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 卢效峰,郑权;基于用户行为分析的搜索引擎模型[J];北方工业大学学报;2004年03期
2 李方伟;闫少军;万丽;;一种新型的电子商务微支付方案[J];重庆邮电大学学报(自然科学版);2011年05期
3 辛勤芳;;基于项目聚类的协同过滤算法研究[J];赤峰学院学报(自然科学版);2011年09期
4 电子商务课题组,王诚庆,荆林波,夏杰长,夏先良,赵萍,杨铁山;关于B2B商业模式的研究[J];财贸经济;2000年10期
5 高厚礼,吴宗杰;扶持中小企业电子商务创新发展的对策研究[J];当代财经;2003年08期
6 黄裕洋;金远平;;一种综合用户和项目因素的协同过滤推荐算法[J];东南大学学报(自然科学版);2010年05期
7 侯治平;;用户行为模式下电子商务网站个性化推荐研究[J];电脑与信息技术;2011年04期
8 柳娟;满家巨;;基于改进的K-均值聚类图像分割算法[J];电脑知识与技术;2008年16期
9 袁琦;;移动支付业务和技术发展现状[J];电信网技术;2011年04期
10 常雪琴;;浅谈甘肃物业管理信息化问题[J];电子商务;2010年08期
中国重要报纸全文数据库 前1条
1 记者 缪亚平;[N];昆明日报;2010年
中国博士学位论文全文数据库 前6条
1 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
2 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
3 王实;基于Web访问信息挖掘的推荐方法研究[D];中国科学院研究生院(计算技术研究所);2001年
4 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
5 陈树桢;电子商务环境下营销渠道选择与协调研究[D];重庆大学;2009年
6 李涛;推荐系统中若干关键问题研究[D];南京航空航天大学;2009年
中国硕士学位论文全文数据库 前10条
1 程淑玉;基于协同过滤算法的个性化推荐系统的研究[D];合肥工业大学;2010年
2 陶启立;基于语义的科技文档信息资源检索系统的设计与实现[D];西北大学;2011年
3 白娟娟;科技档案资源共享机制的研究[D];西北大学;2011年
4 陶沙;基于相似云及兴趣自适应算法的推荐系统研究[D];天津财经大学;2011年
5 封军;基于WEB日志挖掘的频繁模式挖掘算法研究[D];安徽大学;2011年
6 代其锋;基于电子商务的个性化推荐研究[D];中国科学技术大学;2011年
7 郑洪英;数据挖掘聚类算法的分析和应用研究[D];重庆大学;2002年
8 全海金;基于用户行为及语义相关实时更新的用户兴趣模型[D];西南师范大学;2005年
9 杨麟儿;基于用户兴趣的个性化推荐系统的研究与设计[D];北京交通大学;2008年
10 张校慧;基于Web日志与聚类分析的协同过滤算法的设计与实现[D];河南大学;2008年
【二级参考文献】
中国期刊全文数据库 前10条
1 常金玲;夏国平;;基于协调分析的电子商务综合评价方法[J];北京航空航天大学学报(社会科学版);2006年01期
2 崔林,宋瀚涛,陆玉昌;基于语义相似性的资源协同过滤技术研究[J];北京理工大学学报;2005年05期
3 张素兵,刘泽民;基于蚂蚁算法的分级QoS路由调度方法[J];北京邮电大学学报;2000年04期
4 张玉英;孟海东;;数据挖掘技术中聚类算法的改进研究[J];包头钢铁学院学报;2005年04期
5 王菁;;电子政务个性化服务体系结构研究[J];东方企业文化;2007年03期
6 张素兵,吕国英,刘泽民,周正;基于蚂蚁算法的QoS路由调度方法[J];电路与系统学报;2000年01期
7 张向宏;张少彤;王明明;;中国政府网站发展阶段论——政府网站理论基础之二[J];电子政务;2007年03期
8 高琳琦;;电子政务中的个性化信息服务研究[J];电子政务;2007年06期
9 李雪峰;刘鲁;张曌;;基于向量空间模型的在线拍卖商品推荐[J];辽宁工程技术大学学报;2006年02期
10 李德毅;知识表示中的不确定性[J];中国工程科学;2000年10期
中国博士学位论文全文数据库 前3条
1 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
2 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
3 周斌;面向公众服务的电子政务研究[D];同济大学;2007年
中国硕士学位论文全文数据库 前2条
1 裴蕾;基于Web数据挖掘的电子商务推荐系统研究[D];同济大学;2006年
2 曲义飞;基于Web使用挖掘的用户消费模式发现研究[D];大连理工大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 余力,刘鲁,李雪峰;用户多兴趣下的个性化推荐算法研究[J];计算机集成制造系统-CIMS;2004年12期
2 崔亚洲;段刚;;基于Web日志和商品分类的协同过滤推荐系统[J];电子科技大学学报(社科版);2006年03期
3 姜丽红;徐博艺;席俊红;;基于案例推理的过滤算法及智能信息推荐系统[J];清华大学学报(自然科学版);2006年S1期
4 蔡浩;贾宇波;黄成伟;;结合用户信任模型的协同过滤推荐方法研究[J];计算机工程与应用;2010年35期
5 程婷婷;王恒山;刘建国;;用户和项目联合度对二分网络个性化推荐的影响[J];计算机科学;2011年05期
6 郭艳红;邓贵仕;;协同过滤的一种个性化推荐算法研究[J];计算机应用研究;2008年01期
7 查文琴;梁昌勇;曹镭;;基于用户聚类的协同过滤推荐方法[J];计算机技术与发展;2009年06期
8 王岚;翟正军;;基于时间加权的协同过滤算法[J];计算机应用;2007年09期
9 刘丹;褚蓓蓓;郑丽娟;;基于协同过滤的个性化推荐算法研究与实践[J];石家庄铁路职业技术学院学报;2008年02期
10 武建伟;俞晓红;陈文清;;基于密度的动态协同过滤图书推荐算法[J];计算机应用研究;2010年08期
中国重要会议论文全文数据库 前10条
1 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
2 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
3 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
4 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
5 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
6 汤显;郭景峰;高英飞;;基于类别相似性的增量协同过滤推荐算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
7 陶红亮;王明文;曹瑛;;基于项目平滑和聚类的协同过滤推荐算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
8 孙铁利;杨焱;邱春艳;;基于内容预测的协同过滤推荐[A];2005年全国理论计算机科学学术年会论文集[C];2005年
9 林丽冰;师瑞峰;周一民;李月雷;;基于双聚类的协同过滤推荐算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
10 罗喜军;王韬丞;杜小勇;刘红岩;何军;;基于类别的推荐——一种解决协同推荐中冷启动问题的方法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
中国重要报纸全文数据库 前10条
1 商报记者 金朝力;奇艺推3套推荐引擎抢夺视频新制高点[N];北京商报;2011年
2 刘溟;互联网 个性化营销最佳载体[N];经济日报;2004年
3 ;移动经营者的商务机会(未完待续)[N];网络世界;2001年
4 南方;房地产将走向互联网营销[N];中国信息报;2002年
5 商报记者 金朝力;当当布局手机购物战略[N];北京商报;2011年
6 安吉;卓越亚马逊2007年为用户省钱数亿[N];科技日报;2008年
7 猫咪;图片、文件管理助手PaperPort Pro 9 Office[N];中国电脑教育报;2005年
8 孙琎;B2C双巨头七年亏损大战 当当卓越艰难博弈[N];第一财经日报;2007年
9 徐志戎;长尾:从选择成本中获利[N];21世纪经济报道;2006年
10 李新;卓越更名“卓越亚马逊”[N];中国新闻出版报;2007年
中国博士学位论文全文数据库 前10条
1 夏培勇;个性化推荐技术中的协同过滤算法研究[D];中国海洋大学;2011年
2 高旻;基于计算语用学和项目的资源协同过滤推荐研究[D];重庆大学;2010年
3 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年
4 沈磊;心理学模型与协同过滤集成的算法研究[D];北京航空航天大学;2010年
5 孙慧峰;基于协同过滤的个性化Web推荐[D];北京邮电大学;2012年
6 张亮;推荐系统中协同过滤算法若干问题的研究[D];北京邮电大学;2009年
7 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
8 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
9 高滢;多关系聚类分析方法研究[D];吉林大学;2008年
10 肖敏;基于领域本体的电子商务推荐技术研究[D];武汉理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 邵伟;基于领域知识的协同过滤推荐研究[D];河北大学;2010年
2 胡福华;基于可信相似度传递的协同过滤算法研究与应用[D];浙江大学;2011年
3 王均波;协同过滤推荐算法及其改进研究[D];重庆大学;2010年
4 康雨洁;基于协同过滤的个性化社区推荐方法研究[D];中国科学技术大学;2011年
5 李春;协同过滤推荐算法的研究[D];湘潭大学;2010年
6 张晓蕾;协同过滤推荐模型及其在汽车电子商务中的应用研究[D];天津师范大学;2010年
7 白龙;融合数据检测与用户信任的协同过滤算法研究[D];燕山大学;2010年
8 王小亮;基于协同过滤的个性化推荐算法的优化和应用[D];浙江工商大学;2010年
9 庞军;双聚类算法及其在协同过滤中的应用研究[D];大连理工大学;2010年
10 曾小波;基于协同过滤的推荐系统的研究[D];电子科技大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026