收藏本站
《合肥工业大学》 2013年
收藏 | 手机打开
二维码
手机客户端打开本文

协同过滤技术及其在推荐系统中的应用研究

冷亚军  
【摘要】:随着Internet的迅猛发展,网站中的信息急剧增长,人们想要发现、收集和维护自己所需的信息需要花费大量的时间和精力,“信息超载”现象越来越严重。推荐系统是解决这一问题的有效方案,它根据用户的特征,推荐满足用户需求的对象,实现个性化服务。推荐系统在电子商务环境下的作用尤为突出,它可以从三个方面提高网站的收益:将电子商务网站浏览者转变为消费者;提高电子商务网站交叉销售能力;建立电子商务网站客户忠诚度。 协同过滤是目前推荐系统中广泛使用的最成功的推荐技术。它首先找出一组与目标用户偏好一致的邻居用户,然后对邻居用户进行分析,把邻居用户喜欢的项目推荐给目标用户。协同过滤不需要考虑项目的内容,且易于实现,许多大型网站都应用了协同过滤技术为用户提供个性化服务。尽管协同过滤在个性化推荐方面取得了巨大成功,但却面临着数据稀疏性、多内容、可扩展性和群体推荐等关键问题,这些问题制约着其进一步发展,因此需要对这些问题展开深入的研究。 本文的主要研究内容如下: (1)对协同过滤领域的国内外研究进行了全面梳理,在此基础上阐述了协同过滤的基本知识,提炼了协同过滤中存在的关键问题,并介绍了国内外研究人员对这些问题的研究现状。 (2)最近邻选择是协同过滤的核心步骤,通常的做法是计算目标用户与其他用户的相似性,选择相似性最高的前k个用户作为目标用户的最近邻。然而,由于用户的评分向量异常高维、稀疏,使得协同过滤中的最近邻搜寻结果不够合理,从而导致较差的推荐质量较差。基于此,提出一种有效的最近邻选择方法—两阶段最近邻选择算法。给出近邻倾向性的定义,形成初始近邻集合;通过等价关系相似性对初始近邻集合进行修正,使搜寻到的最近邻更加合理。 (3)针对协同过滤的多内容问题,提出了一种基于项类偏好的协同过滤推荐算法。首先为目标用户找出一组项类偏好一致的候选邻居,候选邻居与目标用户兴趣相近,共同评分较多。然后在候选邻居中搜寻目标用户的最近邻,从整体上提高最近邻搜寻的准确性。 (4)针对协同过滤的可扩展性问题,提出了一种改进的近邻传播聚类算法。采用灰关系等级和Jaccard系数对用户相似度矩阵进行定义,缓解评分数据的稀疏性,提高算法的聚类质量。对于算法产生的n个初始聚类,保留Silhouette值较大的前k个聚类,将剩余聚类中的用户按所属类的Silhouette值分配到相应的聚类中,产生指定类数的聚类,加快聚类速度。与原始近邻传播聚类算法相比,新算法在处理协同过滤可扩展性问题方面具有更好的性能。 (5)尽管传统的协同过滤推荐系统在个体用户推荐方面取得了巨大成功,但它并不适用于向群体用户进行推荐。随着虚拟社区中群体用户的不断增加,构建群体推荐系统,向群体用户提供个性化推荐,减少他们搜集信息所耗费的时间和精力显得越来越重要。基于此,提出了一种新颖的推荐方法—结合领域专家法的群体用户推荐算法。该算法以基于项目的协同过滤技术为基础,根据群体成员间的相互作用确定群体偏好,由群体偏好产生推荐,推荐过程中存在的成员未评分项采用领域专家法进行预测填充。此外新算法还考虑了成员间相似关系对推荐质量的影响。 (6)研究了协同过滤推荐问题的一个具体实例—myCFRS电影推荐系统,分析讨论了myCFRS的主要模块及功能结构,给出了myCFRS的开发环境及实现界面。
【学位授予单位】:合肥工业大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:TP391.3

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 张锋;孙雪冬;常会友;赵淦森;;两方参与的隐私保护协同过滤推荐研究[J];电子学报;2009年01期
2 周军锋,汤显,郭景峰;一种优化的协同过滤推荐算法[J];计算机研究与发展;2004年10期
3 李聪;梁昌勇;马丽;;基于领域最近邻的协同过滤推荐算法[J];计算机研究与发展;2008年09期
中国博士学位论文全文数据库 前4条
1 何建民;面向网络社区聆听客户声音方法研究[D];合肥工业大学;2010年
2 夏培勇;个性化推荐技术中的协同过滤算法研究[D];中国海洋大学;2011年
3 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年
4 张亮;推荐系统中协同过滤算法若干问题的研究[D];北京邮电大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 王传旭;王建民;刘晓武;;安徽新农村建设中新型农民培养问题研究——以阜阳、滁州和马鞍山为例[J];安徽广播电视大学学报;2012年02期
2 孙多;;基于兴趣度的聚类协同过滤推荐系统的设计[J];安徽大学学报(自然科学版);2007年05期
3 刘萍;王风英;;不同产地枸杞子微量元素的对应分析[J];安徽农业科学;2008年19期
4 陈志民;李亭;杨敬锋;彭晓琴;;珠海市斗门区水产品病害网络诊断与防治系统算法设计[J];安徽农业科学;2010年17期
5 张淑怡;;广东省城镇居民收入和消费结构的对应分析[J];安徽农业科学;2010年32期
6 高建明;桂枝;袁庆华;高俊杰;丛琳;;NaCl胁迫下苜蓿发芽期性状的相关性研究[J];北方园艺;2010年04期
7 李敏堂;于战果;王贵景;王凤忠;;某新型器材配送车内部结构优化设计分析[J];车辆与动力技术;2006年04期
8 李政;郭兴旺;;因子分析法在脉冲红外热无损检测中的应用[J];北京航空航天大学学报;2010年05期
9 庞倩超;王晏民;;基于粗糙集的数据挖掘[J];北京建筑工程学院学报;2005年04期
10 岳金柱;冯仲科;姜伟;;大兴安岭林区重特大森林火灾扑救时限预测模型构建研究[J];北京林业大学学报;2007年S2期
中国重要会议论文全文数据库 前10条
1 田松;侯妙乐;王晏民;郭宏;;基于面向属性归纳决策树的馆藏壁画病害信息提取[A];第二届“测绘科学前沿技术论坛”论文精选[C];2010年
2 罗艳;黄明初;陆旭安;潘雄伟;;简述数据挖掘在数字档案馆中的应用实现[A];广西计算机学会2010年学术年会论文集[C];2010年
3 杨焰平;陈伟强;;云南农垦天然橡胶产业典型相关分析与可持续发展——基于欧美发达国家广泛关注的先进研究手段实证分析[A];云南省热带作物学会第七次代表大会暨2009年学术年会会议材料[C];2009年
4 王桂芹;黄道;;数据挖掘技术综述[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
5 张力;肖天放;;莆田黑鸭体型性状的主成分分析[A];中国畜牧兽医学会家畜生态学分会第七届全国代表大会暨学术研讨会论文集[C];2008年
6 韩奎国;龚卫国;李伟红;马任飞;史澜;;基于CRM的大型商场POS-MIS系统的设计开发[A];第七届青年学术会议论文集[C];2005年
7 倪青;姜兆顺;;基于结构化糖尿病信息采集系统的2型糖尿病辨证规律研究[A];第六次全国中西医结合中青年学术研讨会论文集[C];2008年
8 庞秀丽;冯玉强;姜维;;电子商务个性化文档推荐技术研究[A];第十届中国管理科学学术年会论文集[C];2008年
9 汤显;郭景峰;高英飞;;基于类别相似性的增量协同过滤推荐算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
10 安迪;孙光东;彭明艳;陈勇;;徐州地区气象条件对感冒疾病的影响及其预报[A];第九届长三角气象科技论坛论文集[C];2012年
中国博士学位论文全文数据库 前10条
1 杨娜;基于云参数干旱遥感监测模型与集合卡尔曼滤波的土壤湿度同化研究[D];武汉大学;2010年
2 张艳;我国东部沿海区域能源安全评价及保障路径设计[D];中国地质大学(北京);2011年
3 蔺源;基于用户行为的网格资源发现相关问题研究[D];北京交通大学;2011年
4 程砚秋;基于支持向量机的农户小额贷款决策评价研究[D];大连理工大学;2011年
5 叶莹;基于数据挖掘技术的痰、饮辨证论治规律的比较研究[D];成都中医药大学;2011年
6 张进春;气流床煤气化工艺性能稳健优化与控制研究[D];中南大学;2011年
7 黄永生;基于用户社会属性的点对点内容分发网络模型研究[D];北京邮电大学;2010年
8 刘小兰;基于图和熵正则化的半监督分类算法[D];华南理工大学;2011年
9 杨向辉;科技资源配置、技术转移与区域经济协调发展研究[D];天津大学;2010年
10 刘宏伟;基于模糊综合评价的管理咨询企业顾客满意度研究[D];天津大学;2009年
中国硕士学位论文全文数据库 前10条
1 熊成喜;水库移民安置区土地流转规模研究[D];华中农业大学;2010年
2 蔡宏果;基于基因表达式编程的Web个性化推荐技术研究[D];广西师范学院;2010年
3 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
4 李善花;中国种业上市公司财务风险评价与控制研究[D];山东农业大学;2010年
5 赵长生;滚动轴承故障特征增强方法与状态预测研究[D];大连理工大学;2010年
6 谷琳;数据挖掘在陶瓷涂层制备中的应用[D];辽宁工程技术大学;2009年
7 李丹丹;基于权重设计的聚类融合算法研究及应用[D];辽宁工程技术大学;2009年
8 许焕霞;基于随机正交变换的隐私保护关联规则挖掘算法[D];辽宁工程技术大学;2009年
9 王赛男;高校人力资源优化配置的数理研究[D];长沙理工大学;2010年
10 肖晴;基于数据仓库的高速公路信息管理系统的研究[D];长沙理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 孙多;;基于兴趣度的聚类协同过滤推荐系统的设计[J];安徽大学学报(自然科学版);2007年05期
2 崔林,宋瀚涛,陆玉昌;基于语义相似性的资源协同过滤技术研究[J];北京理工大学学报;2005年05期
3 陈侠,樊治平;基于互补判断矩阵的专家群体判断一致性分析[J];东北大学学报;2005年06期
4 陈最华;构建远程学习者自主学习模式的基本思路与主要措施[J];中国远程教育;2004年15期
5 赵建华,李克东;CSCL的原理与基本结构(上)[J];电化教育研究;2003年05期
6 刘黄玲子,黄荣怀;CSCL中的交互研究[J];电化教育研究;2005年05期
7 董火明,高隽,胡良梅;多分类器融合的指纹全局特征协同识别[J];电路与系统学报;2005年03期
8 罗永龙 ,黄刘生 ,荆巍巍 ,姚亦飞 ,陈国良;一个保护私有信息的布尔关联规则挖掘算法[J];电子学报;2005年05期
9 黄毅群;卢正鼎;胡和平;李瑞轩;;分布式异常检测中隐私保持问题研究[J];电子学报;2006年05期
10 龚益鸣,丁明芳,崔建;顾客需求识别及其模型[J];复旦学报(自然科学版);2003年05期
中国博士学位论文全文数据库 前4条
1 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
2 李绪蓉;面向业务构件的可重构信息系统的模型研究[D];南京航空航天大学;2002年
3 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
4 郁雪;基于协同过滤技术的推荐方法研究[D];天津大学;2009年
中国硕士学位论文全文数据库 前2条
1 葛润霞;基于内容聚类的协同过滤推荐系统研究[D];山东师范大学;2008年
2 姜百宁;机器学习中的特征选择算法研究[D];中国海洋大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 孙小华;陈洪;孔繁胜;;在协同过滤中结合奇异值分解与最近邻方法[J];计算机应用研究;2006年09期
2 王恒;;基于协同过滤的电子农务推荐系统模型研究[J];宁夏大学学报(自然科学版);2009年04期
3 游文;叶水生;;电子商务推荐系统中的协同过滤推荐[J];计算机技术与发展;2006年09期
4 胡慧蓉;;电子商务个性化推荐系统分析与设计[J];科技创新导报;2009年08期
5 王景波;郑丽英;;混合推荐技术在Web挖掘中的研究[J];科技信息;2010年33期
6 赵宏霞;王新海;杨皎平;;基于用户和项目因子分析的混合协同推荐算法[J];计算机应用;2011年05期
7 刘雨;景青山;;一种用于VOD的推荐系统[J];煤炭技术;2009年10期
8 顾晔;吕红兵;;改进的增量奇异值分解协同过滤算法[J];计算机工程与应用;2011年11期
9 李超然,徐雁斐,张亮;协同推荐pLSA模型的动态修正[J];计算机工程;2005年20期
10 张李义;罗惠恒;;基于协同过滤的WhuRecomm推荐系统的设计与实现[J];武汉大学学报(工学版);2006年06期
中国重要会议论文全文数据库 前10条
1 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
2 汤显;郭景峰;高英飞;;基于类别相似性的增量协同过滤推荐算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
3 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
4 李雪;左万利;赫枫龄;王英;;传统Item-Based协同过滤推荐算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
5 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
6 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
7 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
8 林丽冰;师瑞峰;周一民;李月雷;;基于双聚类的协同过滤推荐算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 何发镁;冯勇;许榕生;王旭仁;;推荐系统安全问题研究综述[A];第13届全国计算机、网络在现代科学技术领域的应用学术会议论文集[C];2007年
10 潘宇;林鸿飞;杨志豪;;基于用户聚类的电子商务推荐系统[A];第三届学生计算语言学研讨会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 本报记者 冯卫东;网络导购:找出你的最爱[N];科技日报;2007年
2 商报记者 金朝力;奇艺推3套推荐引擎抢夺视频新制高点[N];北京商报;2011年
3 刘溟;互联网 个性化营销最佳载体[N];经济日报;2004年
4 林嘉澍;从搜索到发现[N];经济观察报;2007年
5 饶宇锋;微软策动互联网跨越搜索时代[N];财经时报;2007年
6 ;移动经营者的商务机会(未完待续)[N];网络世界;2001年
7 熊明华;九江人才市场打造就业“助推器”[N];中国人事报;2006年
8 镡立勇;2007年度省科技奖推荐工作启动[N];河北经济日报;2007年
9 本报记者  何小龙;委员履职:量化打分[N];江淮时报;2006年
10 记者 温跃通讯员 朱锋 朱沙;农行山东省分行与省教育厅全面合作[N];金融时报;2007年
中国博士学位论文全文数据库 前10条
1 冷亚军;协同过滤技术及其在推荐系统中的应用研究[D];合肥工业大学;2013年
2 沈磊;心理学模型与协同过滤集成的算法研究[D];北京航空航天大学;2010年
3 刘青文;基于协同过滤的推荐算法研究[D];中国科学技术大学;2013年
4 夏培勇;个性化推荐技术中的协同过滤算法研究[D];中国海洋大学;2011年
5 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年
6 高旻;基于计算语用学和项目的资源协同过滤推荐研究[D];重庆大学;2010年
7 张亮;推荐系统中协同过滤算法若干问题的研究[D];北京邮电大学;2009年
8 孙慧峰;基于协同过滤的个性化Web推荐[D];北京邮电大学;2012年
9 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
10 李涛;推荐系统中若干关键问题研究[D];南京航空航天大学;2009年
中国硕士学位论文全文数据库 前10条
1 曾小波;基于协同过滤的推荐系统的研究[D];电子科技大学;2010年
2 邵伟;基于领域知识的协同过滤推荐研究[D];河北大学;2010年
3 王均波;协同过滤推荐算法及其改进研究[D];重庆大学;2010年
4 黄合鑫;电子商务协同过滤算法的研究与实现[D];北京交通大学;2011年
5 胡福华;基于可信相似度传递的协同过滤算法研究与应用[D];浙江大学;2011年
6 白龙;融合数据检测与用户信任的协同过滤算法研究[D];燕山大学;2010年
7 李春;协同过滤推荐算法的研究[D];湘潭大学;2010年
8 张晓蕾;协同过滤推荐模型及其在汽车电子商务中的应用研究[D];天津师范大学;2010年
9 王小亮;基于协同过滤的个性化推荐算法的优化和应用[D];浙江工商大学;2010年
10 康雨洁;基于协同过滤的个性化社区推荐方法研究[D];中国科学技术大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026