收藏本站
《上海交通大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘技术在网站个性化推荐中的应用

彭建光  
【摘要】: Web页面过于复杂,而且是无结构的、动态的,导致人们难以迅速、方便地在Web上找出所需要的数据和信息。Web数据挖掘是从大量的Web文档集合和在站点内进行浏览的相关数据中发现蕴涵的、未知的、有潜在应用价值的、非平凡的模式的过程。它是传统数据挖掘技术在Web环境下的应用。 在网站的设计实现过程中,如果能够根据用户个体的访问兴趣来进行个性化推荐,将会提高用户对网站的浏览效率,更加有针对性的满足用户的需求,从而赢得用户的青睐。通过对用户的访问信息进行Web使用挖掘,进而发现其中的模式,可以有效的实现网页的个性化推荐。 对Web内容挖掘、Web结构挖掘和Web使用挖掘之间的差异进行的对比和深入研究表明,Web使用挖掘在网站的个性化推荐中具有重要意义。通过对Web使用挖掘的一般过程的分析,给出了适合于网站的个性化推荐方案。 分析和比较从客户端、代理端、服务器端及后台数据库获取Web数据的特点及优势,同时分析了各种数据源在数据收集及准确反映用户浏览行为方面的局限性,最终确定了面向服务器端进行Web使用挖掘的方向。进一步分析服务器端数据源的特性,给出了针对此数据源的数据预处理方案及改进方法,提出了数据净化、用户识别、会话识别等关键预处理步骤,以便为其后的挖掘过程提供尽可能准确的数据。 对网页拓扑结构及页面的访问时间进行分析,剔除了非用户兴趣的页面,提高了数据源的准确性。通过分析个性化推荐中关联规则的性质,给出了适合于网页个性化推荐的挖掘方法,并选择了满足该方法的存储结构以及关联规则挖掘算法,在综合考虑页面支持度、访问时间以及当前页面与被推荐页面之间距离等因素的基础上,给出了推荐页面的加权方案,以进一步提高推荐页面的准确率。最后,应用以上方案,对某网站的个性化推荐服务进行了设计。网站的运行结果表明,该方案能够使网站按照预期的设想,在用户浏览的过程中,提供符合用户浏览习惯和兴趣的个性化推荐。
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP393.092;TP311.13

手机知网App
【参考文献】
中国期刊全文数据库 前4条
1 刘云,刘东苏;基于Web的数据仓库与数据挖掘技术[J];情报理论与实践;2001年04期
2 赵志荣,徐恩元;论网络信息资源[J];情报杂志;2001年08期
3 陈莉,焦李成;Internet/Web数据挖掘研究现状及最新进展[J];西安电子科技大学学报;2001年01期
4 赵丹群;数据挖掘:原理、方法及其应用[J];现代图书情报技术;2000年06期
【共引文献】
中国期刊全文数据库 前10条
1 宋中山;挖掘大型数据库中的Apriori算法及其改进[J];中南民族大学学报(自然科学版);2003年01期
2 王玉珍;Web数据挖掘的分析与探索[J];电脑开发与应用;2003年04期
3 王玉珍;Web使用模式挖掘中的几个关键问题研究[J];电脑开发与应用;2003年11期
4 张懿;数据挖掘在电子商务中的应用[J];电脑知识与技术;2005年12期
5 周祥;郑应平;王令群;;基于Web的数据挖掘技术研究及其在电子商务中的应用[J];电脑知识与技术;2005年32期
6 李向伟;仇德成;;数据挖掘技术在Web中的应用研究[J];电脑知识与技术;2006年02期
7 单红花;;web数据挖掘探讨[J];电脑知识与技术;2006年02期
8 向桂林;WEB超链分析及应用[J];大学图书馆学报;2002年02期
9 张庆文;王武魁;;电子政务与数据挖掘技术[J];电子政务;2006年06期
10 陶欢华,蒋凌雁;基于数据挖掘的web行为特征分析与研究[J];福建电脑;2004年03期
中国重要会议论文全文数据库 前10条
1 钟福金;穆斌;;语义Web挖掘研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
2 詹宇斌;殷建平;周文兰;;基于概率关联图挖掘Web日志中有趣关联规则[A];2006年全国理论计算机科学学术年会论文集[C];2006年
3 严奇;温泉;曹杰;;网络化制造环境下分析型CRM模式的产品推荐系统[A];2005亚洲国际过程自动化技术与装备展览会论文集[C];2005年
4 于满泉;谭松波;许洪波;;网页内部结构挖掘技术研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
5 赵立江;何钦铭;;聚类分析在个性化学习中的研究与应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
6 Geng Zengmin~(1,2) Liu Wanchun~1 Zhu Yuwen~1 Yang Jing~2 (1 Computer Department of Beijing Institute of Technology,Beijing,100081,China) (2 China Institute of Atomic Energy,Beijing,102413,China);Applications of Data Mining Technology at Ionization Radiation Metrology[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 1)[C];2005年
7 Do Hyun Ahn;Hee ae Lee;;A Personalized Recommender System Based on Explanation Facilities Using Collaborative Filtering[A];第四届电子商务国际会议论文集(Ⅰ)[C];2004年
8 Cane Wingki Leung;Stephen Chifai Chan;Korris Fulai Chung;;Towards Collaborative Travel Recommender Systems[A];第四届电子商务国际会议论文集(Ⅰ)[C];2004年
9 陈震;陈维默;;浅谈数据挖掘技术[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
10 郝丽;刘乐平;;健康心理学研究与数据挖掘[A];江西省抚州市社科联论文集(2002-2003)教育文化类[C];2003年
中国博士学位论文全文数据库 前10条
1 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
2 刘君强;海量数据挖掘技术研究[D];浙江大学;2003年
3 周明建;基于本体的开放式知识管理研究[D];浙江大学;2004年
4 罗可;数据库中数据挖掘理论方法及应用研究[D];湖南大学;2005年
5 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
6 孙焕良;基于空间划分的优化聚类算法及相关技术研究[D];东北大学;2005年
7 张磊;个性化信息分发及概念检索的研究[D];中国科学院研究生院(计算技术研究所);2002年
8 曲吉林;时间序列挖掘中索引与查询技术的研究[D];天津大学;2006年
9 余小高;电子商务环境中分布式数据挖掘的研究[D];武汉理工大学;2007年
10 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
中国硕士学位论文全文数据库 前10条
1 王蕴;基于数据仓库技术化工企业信息系统的研制[D];浙江大学;2003年
2 李东海;数据挖掘技术在远程教学系统中的应用研究[D];首都师范大学;2003年
3 何波;基于数据挖掘的Web个性化信息推荐研究[D];西南师范大学;2003年
4 王艳;数字图书馆个性化中文文本信息服务系统研究[D];西南师范大学;2003年
5 蔡霞;基于自然语言理解的个性化Web 数据挖掘系统的设计及实现方法研究[D];浙江工业大学;2003年
6 卢启程;基于商务智能决策支持系统的知识管理研究[D];昆明理工大学;2003年
7 贾效虎;铁路货车技术管理信息系统段级建设的设计和实现[D];四川大学;2003年
8 陈鑫卿;搜索引擎技术中的Web结构挖掘算法研究[D];山西大学;2003年
9 吴海红;基于Web日志的数据挖掘[D];武汉科技大学;2003年
10 张德栋;基于神经网络的信用评估模型的研究[D];山东科技大学;2003年
【同被引文献】
中国期刊全文数据库 前8条
1 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
2 王颖楠,滕飞,解莉,孙俏;Web挖掘技术[J];吉林工学院学报(自然科学版);2002年01期
3 李桂林,陈晓云;关于聚类分析中相似度的讨论[J];计算机工程与应用;2004年31期
4 何丽君,董蕊,袁克杰;常见关联规则算法分析与比较[J];大连民族学院学报;2005年05期
5 陆丽娜,杨怡玲,管旭东,魏恒义;Web日志挖掘中的数据预处理的研究[J];计算机工程;2000年04期
6 余力,刘鲁;电子商务个性化推荐研究[J];计算机集成制造系统-CIMS;2004年10期
7 董德民;何钦铭;;面向电子商务的Web挖掘技术及其应用研究[J];计算机工程与设计;2006年01期
8 高岩,胡静涛;Web数据挖掘的原理、方法及用途[J];现代图书情报技术;2002年03期
中国博士学位论文全文数据库 前2条
1 刘刚;数据挖掘技术与分类算法研究[D];中国人民解放军信息工程大学;2004年
2 易明;基于Web挖掘的电子商务个性化推荐机理与方法研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 杨焱;基于项目聚类的协同过滤推荐算法的研究[D];东北师范大学;2005年
2 刘赫;一个基于聚类算法的推荐系统的设计与实现[D];吉林大学;2005年
3 陈学进;Web结构挖掘研究[D];合肥工业大学;2006年
4 张建喜;面向Web日志数据挖掘的研究与应用[D];山东师范大学;2006年
5 张瑞雪;数据挖掘中关联规则算法研究及应用[D];哈尔滨工程大学;2006年
6 翁小兰;WEB挖掘在VOD系统中的研究与应用[D];华东师范大学;2007年
7 叶海琴;网络个性化推荐模型研究[D];郑州大学;2007年
8 赵伟;基于评分预测和概率融合的协同过滤研究[D];河南大学;2007年
9 李凯;Web挖掘在教学资源搜索引擎中的应用研究[D];东北师范大学;2007年
10 鲁为;协作过滤算法及其在个性化推荐系统中的应用[D];北京邮电大学;2007年
【二级参考文献】
中国期刊全文数据库 前3条
1 张立;试论“非资源”信息及其管理[J];情报科学;1999年03期
2 李媚,朱晓峰,臧强;试论网络信息资源开发[J];情报科学;1999年03期
3 张晓娟;网络信息资源:概念、类型及特点[J];图书情报工作;1999年02期
【相似文献】
中国期刊全文数据库 前10条
1 王利;;Web挖掘在个性化学习网站中的应用[J];福建电脑;2006年01期
2 高巨山;任国强;安忠;郭健;;基于Web使用挖掘的个性化网络教育模型研究[J];中国教育信息化;2008年15期
3 谢运洁;;浅论Web使用挖掘[J];中小学图书情报世界;2007年09期
4 刘树超;李永臣;武洪萍;;Web数据挖掘研究与探讨[J];制造业自动化;2010年09期
5 刘延华;桂万云;;基于Web挖掘的个性化远程教学的研究[J];计算机时代;2006年07期
6 雷兵;;Web使用挖掘在B2C网站中的应用研究[J];商业研究;2006年22期
7 杨东东;王艳芬;;Web挖掘[J];内蒙古农业大学学报(自然科学版);2007年01期
8 吴佳楠;;基于Web挖掘的网站优化系统[J];科技信息(学术研究);2008年27期
9 蒋外文,喻兴标,熊东平;Web使用挖掘研究[J];微机发展;2005年08期
10 武勇,杨名利,张昭涛;基于数据挖掘的Web挖掘系统设计研究[J];邢台职业技术学院学报;2005年03期
中国重要会议论文全文数据库 前10条
1 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
2 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
3 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
4 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
5 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
6 王洪锋;;数据挖掘在客户关系管理中的应用研究[A];河南省通信学会2005年学术年会论文集[C];2005年
7 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
8 张婧;;数据挖掘技术在进销存系统中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
9 杨利军;勾学荣;;数据挖掘在移动客户流失预测中的研究和应用[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
10 孙义明;曾继东;;数据挖掘技术及其应用[A];全国计算机安全学术交流会论文集(第二十二卷)[C];2007年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
3 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
6 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
7 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
8 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
9 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
10 ;数据挖掘阻止银行客户流失[N];计算机世界;2007年
中国博士学位论文全文数据库 前10条
1 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
2 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
3 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
4 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
5 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
6 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
7 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
8 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
9 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 吕亚兵;WEB站点日志数据挖掘的研究与实现[D];武汉理工大学;2006年
2 闫永权;基于频繁访问模式树的Web使用挖掘研究[D];湖南大学;2006年
3 彭建光;数据挖掘技术在网站个性化推荐中的应用[D];上海交通大学;2007年
4 覃拥军;基于Web使用挖掘的用户模式识别研究[D];湖南师范大学;2008年
5 邹依依;自适应网站的Web挖掘技术的研究[D];电子科技大学;2008年
6 赵林明;基于数据仓库的信用卡数据挖掘研究[D];山东科技大学;2005年
7 陈骏武;基于数据挖掘技术的电信客户关系管理研究[D];湖南大学;2005年
8 房静;面向CRM的数据挖掘在电力市场营销中的应用[D];天津大学;2004年
9 罗国甫;数据挖掘在银行客户经理考核系统中的应用[D];同济大学;2006年
10 王鑫;数据挖掘中聚类分析算法的研究[D];山东师范大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026