收藏本站
《浙江理工大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于Web使用挖掘的协同过滤推荐算法研究

蔡浩  
【摘要】: 随着互联网技术的不断发展、电子商务应用的不断普及,越来越多的信息充斥在互联网之上。面对如此多的资源,如何快速找到自己真正所需要的信息,成为众多研究学者、理论专家和网络用户关心的关键问题之一。在这样的环境下,推荐系统应运而生。 实现个性化推荐的具体技术有很多种,其中协同过滤推荐是当前电子商务环境下应用最成功和广泛的推荐技术之一。然而随着站点结构、内容复杂度和用户数目的不断增长,协同过滤推荐算法也遇到了实时性、数据稀疏性、可扩展性等种种问题。 传统的协同过滤推荐系统都要求用户对项目进行评分,这样往往会打断用户的浏览过程,甚至影响到用户的情绪;另外相当多的用户不愿意评分,导致评分数据集的极端稀疏。在这种情况下,本文将提出一种基于Web使用挖掘的用户-项矩阵模型的构建方法。该方法通过对Web日志进行有效的数据挖掘,发掘隐藏在日志背后的用户、项目、访问时间和访问次数等信息来获取用户评分值,在不影响用户正常浏览的情况下完成了数据的收集。因为用户对页面的浏览覆盖率比用户对页面的显式评分要更加真实客观,所以相对于传统的数据集,本文提出的方法所收集到的数据要全面得多。 针对传统协同过滤的实时性和数据稀疏性问题,本文将提出一种改进的协同过滤推荐算法。其基本思想是:在原始数据集中结合用户间和项目间的双向信息,即利用用户的最近邻和项目的最近邻对未评分项目进行协同式的平滑处理,以降低矩阵的稀疏程度,解决推荐算法的稀疏性问题。在此基础上,运用数据挖掘领域的聚类算法对系统中所有用户进行用户聚类,尽可能地把相似的用户聚在同一个用户类中,而把不相似的用户聚到不同的用户类中,这一步可采用离线周期进行。在线推荐时,只需要计算目标用户与各个用户聚类簇中心的相似性,然后在最相似的前若干个聚类簇中查找目标用户的最近邻,最后根据目标用户的最近邻居集的信息对各个项目进行评分预测,向目标用户提供推荐。这样缩小了搜索邻居的范围,提高了推荐算法的实时性。 最后通过实验对改进的协同过滤算法进行了测试,验证了算法的合理性和有效性,进而证明了本文提出来的算法可以较有效地克服用户评分数据非常稀疏下传统方法存在的不足之处,有效地提高了推荐算法的实时性和准确性。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王利;;Web挖掘在个性化学习网站中的应用[J];福建电脑;2006年01期
2 阎娟;;Web使用挖掘技术的研究[J];文教资料;2006年24期
3 张彬;蒋涛;;基于个人Web使用挖掘的个性化服务研究[J];株洲工学院学报;2006年04期
4 郑天云;霍成义;;Web使用挖掘及应用研究[J];甘肃科技;2008年04期
5 丁一,卢正鼎;基于web挖掘的用户服务研究[J];计算机仿真;2004年06期
6 张超林;刘丽珍;陈俊杰;;Web使用挖掘中网站结构和内容的作用[J];太原理工大学学报;2006年S1期
7 刘建涛;;基于Web使用挖掘的电子商务个性化服务研究[J];武汉理工大学学报(信息与管理工程版);2006年08期
8 张彬;蒋涛;;一个集成个人Web使用挖掘的个性化模型[J];福建电脑;2006年10期
9 张超林;刘丽珍;陈俊杰;;Web使用挖掘中网站结构和内容的作用[J];太原理工大学学报;2006年S2期
10 张翠英;蔡华利;刘娜;;电子商务个性化服务与Web使用挖掘技术[J];中国管理信息化(综合版);2007年02期
11 高怀金;李国慧;;基于遗传算法的Web使用挖掘研究[J];电脑知识与技术(学术交流);2007年18期
12 张彤;童向兰;;面向企业的Web使用挖掘研究[J];中小企业管理与科技(上旬刊);2008年07期
13 余肖生;;Web使用挖掘的可视化模型研究[J];情报杂志;2008年08期
14 杨斌;董祥军;;基于负关联规则的Web使用挖掘技术及发展趋势[J];微型机与应用;2009年24期
15 游兰,彭庆喜,王时绘;基于Web使用挖掘的个性化站点研究[J];江汉大学学报(自然科学版);2005年03期
16 高巨山;任国强;安忠;郭健;;基于Web使用挖掘的个性化网络教育模型研究[J];中国教育信息化;2008年15期
17 田倩飞;左源瑞;廖鹏;;Web使用挖掘中数据预处理的研究[J];西南师范大学学报(自然科学版);2008年06期
18 王晓静;张晋;;WEB使用挖掘中的数据预处理分析与算法研究[J];辽宁大学学报(自然科学版);2009年02期
19 浦慧忠;;Web使用挖掘在个性化远程教育中的应用研究[J];考试周刊;2010年43期
20 欧阳一鸣,汪曦东,郭骏,刘红樱;Web使用挖掘数据预处理中的会话构造[J];计算机工程与应用;2005年25期
中国重要会议论文全文数据库 前4条
1 刘业政;杨攀;杨慧;;基于Web使用挖掘的在线商业智能研究[A];第10届计算机模拟与信息技术会议论文集[C];2005年
2 谭小球;姚敏;顾沈明;;基于最大频繁序列模式树的个性化页面推荐[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
3 于升峰;;WEB使用挖掘的模式发现[A];信息时代——科技情报研究学术论文集(第二辑)[C];2006年
4 赵立江;何钦铭;;聚类分析在个性化学习中的研究与应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前7条
1 阮备军;Web使用挖掘若干关键问题研究[D];复旦大学;2004年
2 李超锋;Web使用挖掘关键技术研究[D];华中科技大学;2007年
3 肖敏;基于领域本体的电子商务推荐技术研究[D];武汉理工大学;2009年
4 凌海峰;基于ACO的Web使用挖掘方法研究[D];合肥工业大学;2009年
5 周翀;搜索引擎中文档聚类方法研究[D];华中科技大学;2009年
6 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年
7 雷兵;基于网站客户访问行为的客车产品需求获取方法研究[D];武汉理工大学;2013年
中国硕士学位论文全文数据库 前10条
1 汪曦东;Web使用挖掘方法的研究和实现[D];合肥工业大学;2004年
2 王书舟;基于Web挖掘的自适应网站研究[D];哈尔滨理工大学;2003年
3 杨攀;基于WUM个性化推荐方法研究[D];合肥工业大学;2005年
4 谢春丽;基于数据挖掘的Web行为特征分析与研究[D];苏州大学;2003年
5 李凤慧;面向电子商务的Web数据挖掘的研究[D];山东科技大学;2004年
6 陈敏;基于Web使用挖掘的知识发现研究[D];合肥工业大学;2005年
7 刘红祥;Web使用挖掘技术的研究[D];哈尔滨工程大学;2005年
8 隋星光;Web用户浏览模式模糊聚类算法的研究[D];哈尔滨工程大学;2005年
9 梁伟;Web使用挖掘在电子商务推荐系统中的应用研究[D];天津大学;2004年
10 张海玉;基于Web使用挖掘的个性化推荐系统[D];西北大学;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978