收藏本站
《北京邮电大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

推荐系统中协同过滤算法的研究与实现

章晋波  
【摘要】: 随着互联网的迅猛发展,网上的信息越来越多,互联网也逐渐成为人们生活中必不可少的部分了。由于互联网上信息的繁多,用户上网查找资料或者购物都需要花费很多的时间。为了帮助用户更好的查找到自己需要的资料或者自己感兴趣的商品,推荐系统应运而生。推荐系统可以分为很多种类,其中最重要的一种也是最被广泛使用的一种便是协同过滤推荐系统。协同过滤算法是根据用户以往对一些项的评价,以及其他与该用户具有类似兴趣的用户给一些项的评价,将一些新的项目推荐给用户,或者预测对用户有价值的项目。目前,协同过滤技术是一个热点,在研究和应用领域上都取得很大的成功,不过依然还有很多问题需要解决。 协同过滤推荐系统在运用中,主要有四个问题。第一,是算法的准确性问题。由于网上产品的数量非常庞大,用户对产品评价的数量是有限的,使得关于用户和产品的数据是非常稀疏的,其推荐的准确性受到了严重的影响。第二,是可扩展性问题。随着互联网上用户数和项目数的不断增长,如何让系统适应这种变化,也是一个问题。第三,是“冷启动”问题。由于协同过滤是依据用户或者项目的历史评分来实现推荐的,如果当出现一个新的用户时,则无法对他(她)进行推荐,而且也不能给用户推荐一个新的项目。第四,是实时性问题。由于现在很多推荐都是基于在线推荐的,所以对实时性要求很高,目前很多在线推荐都是以牺牲精确性来实现及时性的,如何在不影响精确性的基础来实现实时性也是一个难点问题。 由于算法的准确性是当中最重要的一个问题,所以在该问题上的研究也非常的多。本文研究的工作也是基于这个目的进行开展的,本文主要开展了以下的研究工作: 第一,对未评分项的几种处理方法进行了比较。由于极度的数据稀疏性,用户——项目评分矩阵中含有大量的未评分项,对未评分项的不同处理方法对系统的精确度影响非常的大。在当前已有的计算相似度的算法中,有5种处理方法,本文针对这5种算法进行了实验验证,试验结果表明将未评分项的值设置为0具有最高的准确性。 第二,提出了一种优化的基于项目的协同过滤算法。传统的基于项目的协同过滤算法基于这样一个假设:如果大部分客户对一些商品的评分比较相似,则当前客户对这些商品的评分也比较相似。该算法是利用给定用户对已有项目的喜好属性来预测是否喜爱给定的未知项目。新的算法在计算两个项目相似度的时候,考虑了同时给这两个项目都评分的用户数占给这两个项目有过评分的用户数(包括给两个项目都评分和只给其中一者有过评分的用户数)的比例。实验结果表明,这种优化的基于项目的协同过滤算法比传统的基于项目的协同过滤算法具有更高的准确性。
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP301.6

【参考文献】
中国期刊全文数据库 前5条
1 丁振国,陈静;基于关联规则的个性化推荐系统[J];计算机集成制造系统-CIMS;2003年10期
2 吴颜;沈洁;顾天竺;陈晓红;李慧;张舒;;协同过滤推荐系统中数据稀疏问题的解决[J];计算机应用研究;2007年06期
3 曾春,邢春晓,周立柱;基于内容过滤的个性化搜索算法[J];软件学报;2003年05期
4 邓爱林,朱扬勇,施伯乐;基于项目评分预测的协同过滤推荐算法[J];软件学报;2003年09期
5 刘兴涛;石冰;解英文;;挖掘关联规则中Apriori算法的一种改进[J];山东大学学报(理学版);2008年11期
中国博士学位论文全文数据库 前1条
1 张亮;推荐系统中协同过滤算法若干问题的研究[D];北京邮电大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 汪洁;朱军;;基于Linux的中文垃圾邮件过滤系统设计与实现[J];安徽农业大学学报;2011年02期
2 姚克娟,李晋宏;应用Agent技术实现个性化信息服务[J];北方工业大学学报;2004年03期
3 李伟;黄颖;;基于HtmlParser的网页信息提取[J];兵工自动化;2007年07期
4 高灵渲;张巍;霍颖翔;滕少华;;改进的聚类模式过滤推荐算法[J];江西师范大学学报(自然科学版);2012年01期
5 许建潮;王红梅;;改进的协同过滤算法[J];吉林大学学报(信息科学版);2008年01期
6 辛勤芳;;基于项目聚类的协同过滤算法研究[J];赤峰学院学报(自然科学版);2011年09期
7 廖华;;基于客户生命周期与交易偏好的商品推荐方法[J];大家;2010年08期
8 谭振华;王贺;程维;常桂然;;基于通信历史相关性的P2P网络分布式信任模型[J];东北大学学报(自然科学版);2009年09期
9 赵晓煜;黄小原;曹忠鹏;;基于顾客交易数据的协同过滤推荐方法[J];东北大学学报(自然科学版);2009年12期
10 谭振华;程维;朱志良;王兴伟;;一种多维因子相关的P2P路由信任模型[J];东北大学学报(自然科学版);2010年11期
中国重要会议论文全文数据库 前8条
1 刘英林;刘洪鹏;缪国宇;周莹;赵相东;;基于数据仓库的热轧钢卷改规分析[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
2 王茜;张卫星;;基于分类树相似度加权的协同过滤算法[A];2008年计算机应用技术交流会论文集[C];2008年
3 林丽冰;师瑞峰;周一民;李月雷;;基于双聚类的协同过滤推荐算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
4 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
5 汤显;郭景峰;高英飞;;基于类别相似性的增量协同过滤推荐算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
6 刘勘;尹承明;陈凡;;图书借阅信息的分析与挖掘[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
7 袁晓洁;窦志成;刘芳;张路;;一种基于动态用户模型的个性化Web搜索算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
8 李雪;左万利;赫枫龄;王英;;传统Item-Based协同过滤推荐算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 蔺源;基于用户行为的网格资源发现相关问题研究[D];北京交通大学;2011年
2 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
3 冯景瑜;开放式P2P网络环境下的信任管理技术研究[D];西安电子科技大学;2011年
4 夏培勇;个性化推荐技术中的协同过滤算法研究[D];中国海洋大学;2011年
5 谭振华;结构化P2P覆盖网络路由算法及安全相关技术研究[D];东北大学;2009年
6 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
7 张晓刚;面向软件过程改进的知识管理技术研究[D];中国科学院研究生院(软件研究所);2004年
8 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
9 张树人;从社会性软件、Web2.0到复杂适应信息系统研究[D];中国人民大学;2006年
10 张丙奇;个性化需求的描述、获取与推断—案例研究[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前10条
1 吴则则;支持动态演进的用户兴趣模型挖掘方法研究[D];山东科技大学;2010年
2 蔡宏果;基于基因表达式编程的Web个性化推荐技术研究[D];广西师范学院;2010年
3 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
4 王洋;基于潜在语义分析的智能搜索技术研究[D];哈尔滨工程大学;2010年
5 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
6 何莹杰;个性化图书信息服务技术研究[D];哈尔滨工程大学;2010年
7 刘佳荟;基于信任度量的网构软件动态演化研究[D];哈尔滨工程大学;2010年
8 孟庆海;基于社会书签的个性化查询词扩展技术研究[D];哈尔滨工程大学;2010年
9 李媛;电子商务个性化推荐关键技术研究[D];哈尔滨工程大学;2010年
10 韩兆国;电信计费帐务系统核心模块的设计[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前7条
1 赵亮,胡乃静,张守志;个性化推荐算法设计[J];计算机研究与发展;2002年08期
2 徐章艳,刘美玲,张师超,卢景丽,区玉明;Apriori算法的三种优化方法[J];计算机工程与应用;2004年36期
3 徐章艳,张师超,区玉明,卢景丽,刘美玲;挖掘关联规则中的一种优化的Apriori算法[J];计算机工程;2003年19期
4 曾万聃;周绪波;戴勃;常桂然;李春平;;关联规则挖掘的矩阵算法[J];计算机工程;2006年02期
5 曾春,邢春晓,周立柱;个性化服务技术综述[J];软件学报;2002年10期
6 邓爱林,朱扬勇,施伯乐;基于项目评分预测的协同过滤推荐算法[J];软件学报;2003年09期
7 张毅驰;朱巧明;;改进的关联规则算法及其应用[J];计算机系统应用;2007年10期
【相似文献】
中国期刊全文数据库 前10条
1 游文;叶水生;;电子商务推荐系统中的协同过滤推荐[J];计算机技术与发展;2006年09期
2 顾晔;吕红兵;;改进的增量奇异值分解协同过滤算法[J];计算机工程与应用;2011年11期
3 孙小华;陈洪;孔繁胜;;在协同过滤中结合奇异值分解与最近邻方法[J];计算机应用研究;2006年09期
4 胡慧蓉;;电子商务个性化推荐系统分析与设计[J];科技创新导报;2009年08期
5 赵智;孙琰;;协同过滤算法中推荐集选取方法的研究[J];电脑编程技巧与维护;2009年S1期
6 杨风召;;一种基于特征表的协同过滤算法[J];计算机工程与应用;2007年06期
7 沈磊;周一民;李舟军;;基于心理学模型的协同过滤推荐方法[J];计算机工程;2010年20期
8 王景波;郑丽英;;混合推荐技术在Web挖掘中的研究[J];科技信息;2010年33期
9 王惠敏;聂规划;;基于模糊聚类和资源平滑的协同过滤推荐[J];情报杂志;2007年07期
10 刘鲁;任晓丽;;推荐系统研究进展及展望[J];信息系统学报;2008年01期
中国重要会议论文全文数据库 前10条
1 谢科;刘奕群;岑荣伟;马少平;茹立云;杨磊;;基于维基百科层次分类框架的主题推荐系统的研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 何发镁;冯勇;许榕生;王旭仁;;推荐系统安全问题研究综述[A];第13届全国计算机、网络在现代科学技术领域的应用学术会议论文集[C];2007年
3 王茜;张卫星;;基于分类树相似度加权的协同过滤算法[A];2008年计算机应用技术交流会论文集[C];2008年
4 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
5 潘宇;林鸿飞;杨志豪;;基于用户聚类的电子商务推荐系统[A];第三届学生计算语言学研讨会论文集[C];2006年
6 林丽冰;师瑞峰;周一民;李月雷;;基于双聚类的协同过滤推荐算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
7 沈杰峰;杜亚军;唐俊;;一种基于项目分类的协同过滤算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
8 汤显;郭景峰;高英飞;;基于类别相似性的增量协同过滤推荐算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
9 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
10 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
中国重要报纸全文数据库 前10条
1 本报记者 冯卫东;网络导购:找出你的最爱[N];科技日报;2007年
2 林嘉澍;从搜索到发现[N];经济观察报;2007年
3 饶宇锋;微软策动互联网跨越搜索时代[N];财经时报;2007年
4 商报记者 金朝力;奇艺推3套推荐引擎抢夺视频新制高点[N];北京商报;2011年
5 熊明华;九江人才市场打造就业“助推器”[N];中国人事报;2006年
6 镡立勇;2007年度省科技奖推荐工作启动[N];河北经济日报;2007年
7 本报记者  何小龙;委员履职:量化打分[N];江淮时报;2006年
8 薛求知;我们需要准确地理解西点军校[N];上海证券报;2007年
9 CPW华南区记者 伍羡妮;开放平台 移动商务乍现商机[N];电脑商报;2003年
10 记者 温跃通讯员 朱锋 朱沙;农行山东省分行与省教育厅全面合作[N];金融时报;2007年
中国博士学位论文全文数据库 前10条
1 张亮;推荐系统中协同过滤算法若干问题的研究[D];北京邮电大学;2009年
2 李涛;推荐系统中若干关键问题研究[D];南京航空航天大学;2009年
3 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
4 沈磊;心理学模型与协同过滤集成的算法研究[D];北京航空航天大学;2010年
5 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
6 张寅;个性化技术及其在数字图书馆中应用的研究[D];浙江大学;2009年
7 任磊;推荐系统关键技术研究[D];华东师范大学;2012年
8 夏培勇;个性化推荐技术中的协同过滤算法研究[D];中国海洋大学;2011年
9 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年
10 高旻;基于计算语用学和项目的资源协同过滤推荐研究[D];重庆大学;2010年
中国硕士学位论文全文数据库 前10条
1 章晋波;推荐系统中协同过滤算法的研究与实现[D];北京邮电大学;2010年
2 李惠民;电子商务推荐系统中协同过滤算法的研究[D];吉林大学;2011年
3 王霞;协同过滤在电子商务推荐系统中的应用研究[D];河海大学;2003年
4 寇艳艳;电子商务推荐系统中用户聚类问题与用户兴趣变化问题研究[D];中国科学技术大学;2011年
5 杨焱;基于项目聚类的协同过滤推荐算法的研究[D];东北师范大学;2005年
6 杨晨醒;数字图书馆协同过滤及GPU计算技术研究[D];浙江大学;2010年
7 苏天斌;协同过滤的研究及引擎的实现[D];昆明理工大学;2005年
8 曾小波;基于协同过滤的推荐系统的研究[D];电子科技大学;2010年
9 杨帆;基于数据挖掘的电子商务个性化推荐技术研究[D];西安电子科技大学;2008年
10 青海;电子商务推荐系统核心技术研究[D];北京工业大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026