收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于互联网用户特征的商品推荐系统研究

黄鹏  
【摘要】:随着大数据时代的到来,数据开始呈爆炸式的增长,互联网用户越来越被淹没在数据的海洋之中。因此,如何帮助用户从海量的信息中找到真正感兴趣的资源成为一个亟待解决的问题。商品推荐系统作为电子商务网站一种通用的商品信息过滤手段,通过收集用户的个性化信息,预测用户可能感兴趣的商品,从而进行针对具体用户的个性化商品推荐。但是,传统的商品推荐系统在具体运行中面临着冷启动、数据稀疏性和可扩展性等问题。 本文从商品推荐系统的研究背景、研究意义和研究现状入手,对推荐系统常见算法以及所面临的问题进行了较深入研究。在此基础上,提出了基于用户特征的推荐算法和改进的基于项目的协同过滤算法,从而在一定程度上缓解了推荐系统面临的主要挑战。最后,借助于Mahout、MapReduce、Hive和HBase等工具,本文在Hadoop平台上实现了这些算法,并构建了一个基于用户特征的商品推荐系统原型。总结起来,本文的主要工作体现在以下几个方面: 1)对用户冷启动问题的改进:对多维数据交叉利用方法进行扩展,并通过整合全网络用户行为的日志信息,从中挖掘用户的兴趣及偏好特征,提出了基于用户特征的推荐算法,从而在一定程度上缓解了用户冷启动问题。 2)对数据稀疏性问题的改进:将商品粗粒度化方法应用到传统的协同过滤算法中,提出了改进的基于项目的协同过滤算法。该算法对商品按照品类计算相似度,在此基础上将该品类下评分最高的一些商品推荐给用户,从而在一定程度上缓解了数据稀疏性问题。 3)对可扩展性问题的改进:应用MapReduce、Hive和Mahout工具,在Hadoop上实现了基于用户特征的推荐算法和改进的基于项目的协同过滤算法,完成了算法的并行化,从而在一定程度上提高了系统的可扩展性。本文将商品信息存储到HBase中,用户特征信息存储到Hive中,借助于Hive分析用户的特征,有效地解决了大数据的存储与分析问题。 4)借助于Hadoop、MapReduce、Hive、HBase和Mahout等工具,设计并实现了基于用户特征的商品推荐系统原型。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 苏一丹;王育才;顾新一;;基于独特型人工免疫网络的并行推荐算法的研究[J];计算机应用;2008年05期
2 李聪;梁昌勇;董珂;;基于项目类别相似性的协同过滤推荐算法[J];合肥工业大学学报(自然科学版);2008年03期
3 Scott Wheeler;;商品推荐背后的数学[J];程序员;2009年10期
4 赵智;时兵;;改进的个性化推荐算法[J];长春大学学报;2005年06期
5 李聪;梁昌勇;;基于属性值偏好矩阵的协同过滤推荐算法[J];情报学报;2008年06期
6 张晓云;李慧;王霞;;基于视觉信息的个性化图像搜索排名技术[J];黑龙江科技信息;2009年31期
7 李聪;梁昌勇;杨善林;;电子商务协同过滤稀疏性研究:一个分类视角[J];管理工程学报;2011年01期
8 李涛;王建东;叶飞跃;冯新宇;张有东;;一种基于用户聚类的协同过滤推荐算法[J];系统工程与电子技术;2007年07期
9 王惠敏;聂规划;;基于模糊聚类和资源平滑的协同过滤推荐[J];情报杂志;2007年07期
10 嵇晓声;刘宴兵;罗来明;;协同过滤中基于用户兴趣度的相似性度量方法[J];计算机应用;2010年10期
11 肖满生;王宏;;基于兴趣度向量模型的协同过滤推荐技术研究[J];湖南工业大学学报;2008年04期
12 王纪辉;赵卓宁;;基于协同过滤算法的电子商务网站个性化推荐系统设计[J];成都信息工程学院学报;2007年S1期
13 唐晓波;樊静;;基于客户聚类的商品推荐[J];情报杂志;2009年06期
14 赵晓煜;丁延玲;;基于顾客交易数据的电子商务推荐方法研究[J];现代管理科学;2006年03期
15 赵宏霞;王新海;杨皎平;;基于Web客户因子分析的协同推荐算法[J];计算机应用研究;2011年07期
16 鲁培;;一种改进的基于项目聚类的协同过滤推荐算法[J];科技传播;2011年01期
17 陆洲;程京;张璇;;基于用户兴趣模型聚类的协同过滤推荐算法[J];微计算机信息;2010年33期
18 余小鹏;;一种基于多层关联规则的推荐算法研究[J];计算机应用;2007年06期
19 李涛;王建东;叶飞跃;;推荐系统中一种新的相似性计算方法[J];计算机科学;2007年08期
20 娄建玮;刘红军;郑伟;;C#/SQL实现基于项目评分预测的推荐算法[J];职大学报;2007年04期
中国重要会议论文全文数据库 前10条
1 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
2 陶红亮;王明文;曹瑛;;基于项目平滑和聚类的协同过滤推荐算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
3 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
4 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
5 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
6 汤显;郭景峰;高英飞;;基于类别相似性的增量协同过滤推荐算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
7 王韬丞;罗喜军;杜小勇;;基于层次的推荐:一种新的个性化推荐算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
8 梁莘燊;刘莹;;基于效能的学术资源推荐算法研究[A];第六届(2011)中国管理学年会——信息管理分会场论文集[C];2011年
9 孙铁利;杨焱;邱春艳;;基于内容预测的协同过滤推荐[A];2005年全国理论计算机科学学术年会论文集[C];2005年
10 高凤荣;杜小勇;王珊;;数字图书馆环境下一种基于语义分类的个性化推荐算法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
中国博士学位论文全文数据库 前10条
1 刘青文;基于协同过滤的推荐算法研究[D];中国科学技术大学;2013年
2 高旻;基于计算语用学和项目的资源协同过滤推荐研究[D];重庆大学;2010年
3 沈磊;心理学模型与协同过滤集成的算法研究[D];北京航空航天大学;2010年
4 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年
5 孔维梁;协同过滤推荐系统关键问题研究[D];华中师范大学;2013年
6 夏培勇;个性化推荐技术中的协同过滤算法研究[D];中国海洋大学;2011年
7 刘淇;基于用户兴趣建模的推荐方法及应用研究[D];中国科学技术大学;2013年
8 冷亚军;协同过滤技术及其在推荐系统中的应用研究[D];合肥工业大学;2013年
9 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年
10 董振华;群落标签推荐系统体系结构及关键问题研究[D];南开大学;2012年
中国硕士学位论文全文数据库 前10条
1 王小亮;基于协同过滤的个性化推荐算法的优化和应用[D];浙江工商大学;2010年
2 刘亭;隐私保持协同过滤推荐算法研究[D];燕山大学;2010年
3 袁先虎;基于混合用户模型的协同过滤推荐算法研究[D];重庆大学;2010年
4 李春;协同过滤推荐算法的研究[D];湘潭大学;2010年
5 李有超;基于项目属性与偏爱比较的协同过滤推荐算法研究[D];燕山大学;2010年
6 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
7 黄鹏;基于互联网用户特征的商品推荐系统研究[D];东华大学;2014年
8 张晓蕾;协同过滤推荐模型及其在汽车电子商务中的应用研究[D];天津师范大学;2010年
9 胡福华;基于可信相似度传递的协同过滤算法研究与应用[D];浙江大学;2011年
10 封素石;分布式协同过滤推荐算法研究[D];燕山大学;2010年
中国重要报纸全文数据库 前10条
1 本报记者 李培;商品推荐,如何才能“费心落好”[N];东方烟草报;2010年
2 记者 王夕;网络也会“读心术”[N];北京科技报;2011年
3 ;网上开店技巧[N];市场报;2006年
4 记者 金晓东;甬城团购投诉今年明显上升了[N];宁波日报;2010年
5 李晓敏;农博通:第一时间攥商机[N];农民日报;2004年
6 商报记者 金朝力;奇艺推3套推荐引擎抢夺视频新制高点[N];北京商报;2011年
7 记者 王胜昔通讯员 李世强 魏万里;杞县:网上建起“农贸市场”[N];河南日报;2008年
8 本报见习记者 张维维;网上开店:小本赚大钱[N];北方经济时报;2005年
9 编辑 韩迪 张长山 周尚斗 张春 廖颖谊 田永丽 王媛 姜淑芹 章恒;今又“五一”大检查 各出新招更精细[N];中国安全生产报;2006年
10 商闻;京郊连锁企业“联席”采购[N];中国商报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978