收藏本站
《郑州大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

基于WEB日志挖掘的智能化站点研究

夏敏捷  
【摘要】:随着网络规模的迅猛发展以及用户需求的膨胀,Internet已成为人们信息发布,娱乐和交流的媒体。尽管Internet提供大量的信息和搜索门户网站,但用户往往无法找到自己所需的内容。WEB站点的日志数据记录了浏览用户对此WEB站点访问时的大量路径信息,对这些信息的分析有利于网站设计人员掌握用户的爱好和习惯,网站设计人员可以用来对网站的结构进行优化和页面重组。更重要的是智能化站点能够通过历史日志数据自动对用户未来访问页面进行预测。 本文首先对WEB挖掘技术分类进行介绍,并针对WEB日志挖掘系统体系结构进行分析,重点介绍预处理过程的步骤及难点。其后将关联规则挖掘技术应用到日志事务会话中,介绍了传统的关联规则发现的Apriori挖掘算法,在对日志数据的特性分析的基础上提出类Apriori挖掘算法。 本文对类Apriori挖掘算法得到的频繁项集如何有效提取关联规则提出五种方法,通过试验对比,我们得出了最有效的方法。在实际应用中,如何从多个匹配的关联规则中选择合适的规则,本文提出两种匹配规则思想。 最后简单介绍聚类思想,提出基于密度的递归聚类应用到日志的挖掘算法。通过递归聚类算法找到几组相关页面集合,从而可能为推荐系统提供与当前用户访问会话序列符合的页组,推荐系统根据此页组预测可能访问的后继页面。
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2003
【分类号】:TP393.092

【引证文献】
中国硕士学位论文全文数据库 前1条
1 郑奎;WEB点击流构建个性化信息服务[D];上海交通大学;2008年
【参考文献】
中国期刊全文数据库 前10条
1 张静,田忠和;基于IIS和web日志的关联关系的挖掘[J];华中科技大学学报(自然科学版);2002年08期
2 谢丹夏;Web上的数据挖掘技术和工具设计[J];计算机工程与应用;2001年06期
3 邓英,李明;Web数据挖掘技术及工具研究[J];计算机工程与应用;2001年20期
4 邓英,李明;用户访问模式挖掘中数据预处理问题的研究[J];计算机工程与应用;2002年01期
5 陈新中,李岩,谢永红,杨炳儒;Web挖掘研究[J];计算机工程与应用;2002年13期
6 吴强;梁继民;杨万海;;Web日志挖掘预处理中的用户识别技术[J];计算机科学;2002年04期
7 肖立英,李建华,谭立球;Web日志挖掘技术的研究与应用[J];计算机工程;2002年07期
8 施建生,伍卫国,陆丽娜,杨怡玲;Web日志中挖掘用户浏览模式的研究[J];西安交通大学学报;2001年06期
9 潘登,董小社,杨麦顺,冯锐,张晓亮;从Web数据中挖掘频繁访问模式[J];西安交通大学学报;2002年06期
10 邢东山,宋擒豹,沈钧毅;一种新的Web事务模糊聚类算法的研究[J];西安交通大学学报;2002年08期
【共引文献】
中国期刊全文数据库 前10条
1 叶彩虹;Web挖掘在网上购物中的应用研究[J];安庆师范学院学报(自然科学版);2004年04期
2 洪梅;;Web日志挖掘在电子商务中的应用[J];长春大学学报;2008年10期
3 李儒银;;基于IIS的站点安全设置与管理[J];长沙通信职业技术学院学报;2009年02期
4 李淑领;;网络社区中的虚拟身份挖掘[J];沧州师范专科学校学报;2008年03期
5 王霞俊;;基于Web使用挖掘的实时推荐技术[J];常州轻工职业技术学院学报;2006年01期
6 赵文忠;张长利;房俊龙;;Web日志挖掘在农业网站的应用[J];东北农业大学学报;2010年08期
7 钱同海;彭显刚;焦悦东;;基于Web数据挖掘的节电降耗实时分析系统设计[J];电力科学与工程;2011年08期
8 吴梦杰;陈红琳;;基于Web日志挖掘的用户兴趣度分析[J];智能计算机与应用;2011年06期
9 张骏;史振华;白丽晗;;基于.NET的Web结构挖掘技术研究及应用[J];电脑编程技巧与维护;2009年04期
10 范建中;王福庆;;基于Web的数据挖掘技术研究与应用[J];电脑编程技巧与维护;2009年12期
中国重要会议论文全文数据库 前1条
1 吴雯雯;王浩;杨静;;基于用户访问模式的个性化推荐算法研究[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
中国博士学位论文全文数据库 前10条
1 刘雪梅;服务器端软件性能分析和诊断方法研究[D];哈尔滨工程大学;2010年
2 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
3 梁成军;网球技战术决策支持系统研究与应用[D];上海体育学院;2011年
4 刘慧君;用户浏览模式挖掘方法与应用研究[D];重庆大学;2010年
5 刘扬;基于Web的区域经济增长分析PSE模式与应用研究[D];华东师范大学;2003年
6 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年
7 傅明;基于Web的空间数据挖掘研究[D];中南大学;2004年
8 余轶军;Web访问信息挖掘若干关键技术的研究[D];浙江大学;2006年
9 易明;基于Web挖掘的电子商务个性化推荐机理与方法研究[D];华中科技大学;2006年
10 凌海峰;基于ACO的Web使用挖掘方法研究[D];合肥工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 王宇轩;电子信箱的可用性实验研究[D];浙江理工大学;2010年
2 王彬;网络取证分析技术的研究[D];长春工业大学;2010年
3 钟冠群;聚类算法在B2M电子商务中的应用研究[D];长春工业大学;2010年
4 李雪妍;基于Web数据挖掘在个性化远程教学系统中的应用研究[D];电子科技大学;2010年
5 徐海兰;Web日志挖掘技术在个性化信息推荐中的应用[D];延边大学;2009年
6 张砚明;基于链接结构分析的Web页面排序算法[D];西安电子科技大学;2010年
7 吴全永;基于数据挖掘的入侵检测技术研究[D];北方工业大学;2011年
8 詹圣君;基于用户行为日志分析的搜索引擎排序算法研究[D];湖北工业大学;2011年
9 陈博;网上商店用户潜在购物需求的信息表达[D];吉林大学;2011年
10 杨鹏;Web日志挖掘数据预处理算法研究与实现[D];北京邮电大学;2011年
【同被引文献】
中国期刊全文数据库 前9条
1 崔林,宋瀚涛,陆玉昌;基于语义相似性的资源协同过滤技术研究[J];北京理工大学学报;2005年05期
2 周军锋,汤显,郭景峰;一种优化的协同过滤推荐算法[J];计算机研究与发展;2004年10期
3 李逸波;于吉红;白晓明;;合理选择数据挖掘工具[J];计算机与信息技术;2005年06期
4 黄文蓓;杨静;顾君忠;;基于分块的网页正文信息提取算法研究[J];计算机应用;2007年S1期
5 林鸿飞,杨志豪,赵晶;基于内容和合作模式的信息推荐机制[J];中文信息学报;2005年01期
6 岳修志;图书馆点击流数据仓库研究[J];情报科学;2005年06期
7 易明;张扬;;基于全信息的“点击流”信息资源开发利用研究[J];情报科学;2007年02期
8 杜文华;;基于点击流技术的个性化信息服务研究[J];情报杂志;2006年10期
9 邓爱林,左子叶,朱扬勇;基于项目聚类的协同过滤推荐算法[J];小型微型计算机系统;2004年09期
中国博士学位论文全文数据库 前2条
1 丁连红;基于信息流的个性化服务研究[D];中国科学院研究生院(计算技术研究所);2006年
2 赵鹏;复杂网络与互联网个性化信息服务的研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前4条
1 陈安;数据仓库和数据挖掘技术在税务系统的应用[D];安徽大学;2003年
2 符燕华;Web文本数据挖掘研究[D];同济大学;2006年
3 童毕建;基于点击流技术的个性化信息服务应用研究[D];对外经济贸易大学;2006年
4 沈斌;基于分词的中文文本相似度计算研究[D];天津财经大学;2006年
【二级引证文献】
中国期刊全文数据库 前1条
1 易明;操玉杰;毛进;;基于点击流的个性化信息检索研究[J];情报科学;2011年04期
中国硕士学位论文全文数据库 前1条
1 孙倩;基于点击流分析的电子商务个性化服务研究[D];河北工业大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 骆洪青,吴小俊,曹奇英;模糊聚类分析的一种新方法研究[J];华东船舶工业学院学报;2000年03期
2 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
3 宋擒豹,沈钧毅;Web日志的高效多能挖掘算法[J];计算机研究与发展;2001年03期
4 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期
5 谢丹夏;Web上的数据挖掘技术和工具设计[J];计算机工程与应用;2001年06期
6 王实;高文;李锦涛;;Web数据挖掘[J];计算机科学;2000年04期
7 刘明吉;王秀峰;黄亚楼;;数据挖掘中的数据预处理[J];计算机科学;2000年04期
8 陆丽娜,杨怡玲,管旭东,魏恒义;Web日志挖掘中的数据预处理的研究[J];计算机工程;2000年04期
9 陈才扣,金远平;基于Web的时间序列模式挖掘[J];计算机应用研究;2000年07期
10 施建生,伍卫国,陆丽娜,杨怡玲;Web日志中挖掘用户浏览模式的研究[J];西安交通大学学报;2001年06期
【相似文献】
中国期刊全文数据库 前10条
1 钟晓;马少平;张钹;俞瑞钊;;数据挖掘综述[J];模式识别与人工智能;2001年01期
2 郭蕾蕾;何明祥;;浅谈数据挖掘在电子商务领域的应用[J];中国科技信息;2008年12期
3 张瑶;陈高云;王鹏;;数据挖掘技术在试卷分析中的应用[J];西南民族大学学报(自然科学版);2008年04期
4 万红新,聂承启,尹红;数据挖掘中的模糊聚类实现技术[J];计算机与现代化;2003年11期
5 刘俊霞;杨玉霞;;数据挖掘中关联规则及聚类并行算法研究[J];中州大学学报;2009年03期
6 刘宏彬,邓洪志,路松峰;聚类布尔和分类数据[J];华中科技大学学报;2001年03期
7 戴永群;数据挖掘在教学中的应用[J];福建电脑;2005年09期
8 巢时刚;;数据挖掘在远程考试系统中的应用[J];福建电脑;2007年06期
9 徐永良;;推荐技术在电子商务中的应用研究[J];电脑与电信;2007年09期
10 唐晓琴;屈正庚;;Web使用挖掘技术在电子商务中的应用[J];和田师范专科学校学报;2010年04期
中国重要会议论文全文数据库 前10条
1 朱强生;田英;周延泉;何华灿;;银行业中的客户数据挖掘[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
2 李阳;徐锡山;韩伟红;郑黎明;徐镜湖;;网络安全事件关联规则的自动化生成方法研究与实践[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
3 左万利;刘居红;;包含正负属性的关联规则及其挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
4 王宁;董淳;胡运发;陶晓鹏;;面向集合的关联规则挖掘算法[A];第十五届全国数据库学术会议论文集[C];1998年
5 周焕银;张永;;关联规则候选项频度规律研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
6 方艳;别荣芳;;关联规则的有趣性研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
7 黄晓燕;许龙飞;;基于关联规则的网络入侵检测技术的应用研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
8 李庆忠;张世栋;董国庆;;在数据多维体中进行关联规则的挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
9 韩涛;张春海;;关系数据库中关联规则的高效挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
10 潘海为;李建中;张炜;;挖掘脑部医学图像中的关联规则[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
中国重要报纸全文数据库 前10条
1 王云鹤 熊立;武汉电信直销中心剑指聚类市场[N];人民邮电;2009年
2 记者 肖卓;聚类市场:想挖金矿不容易[N];人民邮电;2009年
3 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
4 张秋;突破聚类市场的信息化盲区[N];中国计算机报;2007年
5 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
6 严宁;挖掘数据寻保险商机[N];网络世界;2007年
7 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
8 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
9 符信;30个指标评价社会发展水平[N];南方日报;2005年
10 记者 李远治 通讯员 邹超 敖翔;重庆号百传媒探索聚类市场新模式[N];人民邮电;2009年
中国博士学位论文全文数据库 前10条
1 贾俊杰;空间数据挖掘中若干关键技术研究[D];长安大学;2009年
2 陈莉;KDD中的几个关键问题研究[D];西安电子科技大学;2003年
3 肖波;可信关联规则挖掘算法研究[D];北京邮电大学;2009年
4 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年
5 叶小飞;基于自发呈报系统与循证医学的药品不良反应信号挖掘[D];第二军医大学;2011年
6 伊卫国;基于关联规则与决策树的预测方法研究及其应用[D];大连海事大学;2012年
7 Vital Delmas MABONZO;大型数据库有效挖掘关联规则新方法研究[D];大连海事大学;2012年
8 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年
9 陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;2010年
10 王春雨;刑事案件关联分析与防控警务模式研究[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 张爱芳;基于密度网格的关联规则开采及聚类算法[D];华中科技大学;2004年
2 丁健;传感器网络中的数据挖掘[D];黑龙江大学;2005年
3 张大治;飞机典型装配工艺挖掘技术研究[D];西北工业大学;2006年
4 马朝阳;基于支持向量机的工业数据挖掘技术研究[D];浙江大学;2006年
5 涂明;关联规则增量式更新算法研究[D];合肥工业大学;2010年
6 王景;基于关联规则数据挖掘的研究[D];广西大学;2003年
7 汤亚玲;基于遗传算法的Web关联规则挖掘的研究与设计[D];苏州大学;2004年
8 岳慧颖;含有时空约束的关联规则挖掘方法研究[D];哈尔滨工程大学;2004年
9 聂倩雯;基于关联规则数据挖掘和扩展贝叶斯网络的电网故障诊断方法研究[D];西南交通大学;2010年
10 赵春胜;基于关联规则的数据挖掘方法在电厂脱硫监测中的应用研究[D];内蒙古大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026