收藏本站
《浙江大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

协同过滤系统的稀疏性与冷启动问题研究

孙小华  
【摘要】:推荐系统通过预测用户对项目的喜好程度来为用户进行信息过滤,应用知识发现技术来生成个性化推荐。协同过滤是一种常用的减少信息过载的技术,已经成为了个性化推荐系统的一种主要工具,然而现有大多数协同过滤算法存在着几个主要问题:精确性,数据稀疏和冷启动问题。许多结合协同过滤与基于内容的信息过滤的算法可以解决这些问题,但是这些算法需要预先得到项目的内容信息或者用户的个人信息,而这些信息在很多推荐系统中是无法获得的,因此无法利用基于内容的信息过滤技术。 本文提出了在无法得到项目的内容信息和用户个人信息的情况下,在数据稀疏和冷启动情况下提高预测准确性的几种方法。在三个公开的数据集上进行了试验,试验结果显示这些方法比常用的算法效果要好。 我们采用了两种方法来提高数据稀疏时预测的准确性,即属于特征递增型的Pear After SVD方法和属于转换型的LCM_STI方法。在特征递增型方法中,一种方法的输出用来作为另一种方法的输入。Pear_After_SVD算法首先利用基于奇异值分解的方法来得到预测的评分,然后采用这些预测结果来获得活动用户的邻居,最后用基于邻居的Pearson算法得到最终提供给用户的预测值。在转换型方法中,推荐系统根据当前的情况决定在不同的推荐方法中进行转换。LCM STI算法设置了一个阈值来决定如何在基于潜在分类模型的Pearson算法与STIN1算法这两种协同过滤方法中进行转换。在基于潜在分类模型的Pearson算法中,首先使用潜在分类模型的结果来进行邻居选择,然后根据最近邻方法来对活动用户未打分项目的评分进行预测。试验结果表明这两种方法在数据稀疏时准确性较高。 冷启动问题包括新项目问题与新用户问题。我们采用了基于统计的众数法以及信息熵法来解决冷启动问题。在基于统计的众数法中,利用人们的从众心理,对新用户问题,我们用所有用户在某一项目上的评分的众数作为新用户在
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李聪;梁昌勇;;基于属性值偏好矩阵的协同过滤推荐算法[J];情报学报;2008年06期
2 王恒;;基于协同过滤的电子农务推荐系统模型研究[J];宁夏大学学报(自然科学版);2009年04期
3 孙小华;陈洪;孔繁胜;;在协同过滤中结合奇异值分解与最近邻方法[J];计算机应用研究;2006年09期
4 张李义;罗惠恒;;基于协同过滤的WhuRecomm推荐系统的设计与实现[J];武汉大学学报(工学版);2006年06期
5 王卫平;王金辉;;基于Tag和协同过滤的混合推荐方法[J];计算机工程;2011年14期
6 吴杉;;引入用户权威性的分类协同过滤推荐算法的研究[J];焦作师范高等专科学校学报;2008年01期
7 张海鹏;李烈彪;李仙;周亚蜂;;基于项目分类预测的协同过滤推荐算法[J];情报学报;2008年02期
8 李珊;何建敏;厉浩;;基于知识的协同过滤推荐系统研究[J];情报学报;2008年03期
9 李聪;梁昌勇;杨善林;;电子商务协同过滤稀疏性研究:一个分类视角[J];管理工程学报;2011年01期
10 王卫平;刘颖;;基于客户行为序列的推荐算法[J];计算机系统应用;2006年09期
11 李益群;张文生;杨柳;刘琰琼;;基于标签的强化学习推荐算法研究与应用[J];计算机应用研究;2010年08期
12 王惠敏;聂规划;;融合用户和项目相关信息的协同过滤算法研究[J];武汉理工大学学报;2007年07期
13 王志军;岳训;付冬菊;苗良;;基于Web投票机制的免疫协同过滤推荐技术研究[J];农业网络信息;2010年01期
14 游文;叶水生;;电子商务推荐系统中的协同过滤推荐[J];计算机技术与发展;2006年09期
15 胡慧蓉;;电子商务个性化推荐系统分析与设计[J];科技创新导报;2009年08期
16 赵宏霞;王新海;杨皎平;;基于用户和项目因子分析的混合协同推荐算法[J];计算机应用;2011年05期
17 项武;;基于评分区间相似性的协同过滤推荐算法[J];微电子学与计算机;2010年07期
18 唐晓波;樊静;;基于客户聚类的商品推荐[J];情报杂志;2009年06期
19 顾晔;吕红兵;;改进的增量奇异值分解协同过滤算法[J];计算机工程与应用;2011年11期
20 赵宏霞;王新海;杨皎平;;基于项目因子分析的Web客户需求协同推荐算法[J];计算机系统应用;2011年07期
中国重要会议论文全文数据库 前10条
1 汤显;郭景峰;高英飞;;基于类别相似性的增量协同过滤推荐算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
2 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
4 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
5 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
6 谢科;刘奕群;岑荣伟;马少平;茹立云;杨磊;;基于维基百科层次分类框架的主题推荐系统的研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 李雪;左万利;赫枫龄;王英;;传统Item-Based协同过滤推荐算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
8 何发镁;冯勇;许榕生;王旭仁;;推荐系统安全问题研究综述[A];第13届全国计算机、网络在现代科学技术领域的应用学术会议论文集[C];2007年
9 潘宇;林鸿飞;杨志豪;;基于用户聚类的电子商务推荐系统[A];第三届学生计算语言学研讨会论文集[C];2006年
10 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国重要报纸全文数据库 前10条
1 丁皓;印陆军“冷启动”新作战理论[N];中国国防报;2004年
2 博瑞祥弘;常见冷启动故障分析[N];中国消费者报;2005年
3 郭振海;冷启动后发动机为什么抖动?[N];中国交通报;2002年
4 本报记者 冯卫东;网络导购:找出你的最爱[N];科技日报;2007年
5 叶莲;印陆军要买1000辆T-90S坦克[N];中国国防报;2008年
6 北雪;3月空调市场冷启动[N];中国经营报;2003年
7 郑建国;现代索纳塔轿车 冷启动困难[N];中国汽车报;2001年
8 王涛;印陆军演练核条件下奔袭作战[N];中国国防报;2007年
9 本报记者 郭峰冰;中移动GPRS冷启动[N];中国质量报;2002年
10 记者 张新生;巴西推出冷启动混合燃料汽车[N];科技日报;2009年
中国博士学位论文全文数据库 前10条
1 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
2 李涛;推荐系统中若干关键问题研究[D];南京航空航天大学;2009年
3 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年
4 郭艳红;推荐系统的协同过滤算法与应用研究[D];大连理工大学;2008年
5 张亮;推荐系统中协同过滤算法若干问题的研究[D];北京邮电大学;2009年
6 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
7 任磊;推荐系统关键技术研究[D];华东师范大学;2012年
8 沈磊;心理学模型与协同过滤集成的算法研究[D];北京航空航天大学;2010年
9 夏培勇;个性化推荐技术中的协同过滤算法研究[D];中国海洋大学;2011年
10 张寅;个性化技术及其在数字图书馆中应用的研究[D];浙江大学;2009年
中国硕士学位论文全文数据库 前10条
1 章晋波;推荐系统中协同过滤算法的研究与实现[D];北京邮电大学;2010年
2 王霞;协同过滤在电子商务推荐系统中的应用研究[D];河海大学;2003年
3 李惠民;电子商务推荐系统中协同过滤算法的研究[D];吉林大学;2011年
4 寇艳艳;电子商务推荐系统中用户聚类问题与用户兴趣变化问题研究[D];中国科学技术大学;2011年
5 杨焱;基于项目聚类的协同过滤推荐算法的研究[D];东北师范大学;2005年
6 曾小波;基于协同过滤的推荐系统的研究[D];电子科技大学;2010年
7 邵伟;基于领域知识的协同过滤推荐研究[D];河北大学;2010年
8 李雪;基于协同过滤的推荐系统研究[D];吉林大学;2010年
9 庞军;双聚类算法及其在协同过滤中的应用研究[D];大连理工大学;2010年
10 李春;协同过滤推荐算法的研究[D];湘潭大学;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978