收藏本站
《武汉理工大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

WEB站点日志数据挖掘的研究与实现

吕亚兵  
【摘要】:Web站点日志的数据挖掘是对用户与Web服务器的交互产生的日志数据使用数据挖掘技术发现隐含的规律性知识,得到用户的访问模式和用户的兴趣,从而为用户的个性化服务提供依据,同时将一些可疑的访问信息及时反馈给网站管理员以加强网站的安全性。本系统以Web日志和Web拓扑结构作为数据源,从数据收集、数据预处理和数据挖掘分析三个阶段阐述系统的整体结构和实现,系统采用图论来表现关联规则挖掘的优化算法并给出部分JAVA代码实现。引入关联规则挖掘,对关联规则基本概念作了介绍,提出了关联规则的分类方法。对挖掘算法的介绍,对传统相似度聚类分析进行了研究并做出了改进。基于安全的考虑提出了正常浏览模式、异常浏览模式的概念并利用改进的相似度进行挖掘。对传统的Apriori算法进行改进,提出了用图论的方法即大图法来挖掘用户偏好路径,发现用户的访问兴趣。提出了基于Web日志挖掘技术的站点日志挖掘体系结构,为进一步实现Web站点智能化服务打下基础。 本论文的结构如下: 第1章:对目前的数据挖掘技术进行了分析,着重指出了Web挖掘的国内外研究现状和热点,阐述了最新的数据挖掘分类,并提出了研究站点日志挖掘的主要内容和意义。第2章:详细讲述Web数据挖掘,阐述当前Web数据挖掘的最新分类和由于数据的结构性不同所面临的困难,最后重点讲述日志和日志挖掘实现流程。第3章:讲述了Web日志挖掘中的信息收集。不同信息源分析和信息收集的过程。第4章:从数据预处理的目的、过程、程序实现以及相关数据库建立等方面分析了日志挖掘的数据预处理过程,重点阐述了数据净化、用户识别、路径补充和事务识别。第5章:讨论如何进行日志挖掘和相应的算法分析。包括采用会话相似度分析将日志记录分为正常访问模式和异常访问记录,引入大图法采用关联规则分析用户的偏好路径。第6章:给出了日志挖掘系统的实验体系和部分实验结果。第7章:总结了本课题研究成果主要有四点,指出了需要进一步改进的方面。
【学位授予单位】:武汉理工大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP311.13

免费申请
【相似文献】
中国期刊全文数据库 前10条
1 高阳;;中国数据挖掘研究进展[J];南京大学学报(自然科学版);2011年04期
2 陈瑛琦;扶晓;刘劲;;可视化数据挖掘技术[J];电脑编程技巧与维护;2011年14期
3 罗健萍;吴海;;数据挖掘技术中基于关联规则算法的研究[J];硅谷;2011年13期
4 蒋晖;陈允锋;;数据挖掘及其一种关联规则算法[J];计算机与数字工程;2011年06期
5 金育婵;;数据挖掘技术中基于关联规则算法的研究[J];科技传播;2011年12期
6 唐学军;;基于网格的运动训练数据挖掘研究[J];现代计算机(专业版);2011年10期
7 王娜敏;高艺博;;基于数据挖掘技术的入侵检测系统[J];电脑知识与技术;2011年21期
8 王海军;;数据挖掘提高企业决策分析[J];福建电脑;2011年06期
9 田伟;殷淑娥;;浅析数据挖掘[J];甘肃科技;2011年12期
10 白建伟;;数据挖掘技术在高校图书馆管理中的应用[J];山西青年管理干部学院学报;2011年02期
中国重要会议论文全文数据库 前10条
1 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
2 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
3 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
4 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
5 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
6 王洪锋;;数据挖掘在客户关系管理中的应用研究[A];河南省通信学会2005年学术年会论文集[C];2005年
7 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
8 张婧;;数据挖掘技术在进销存系统中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
9 杨利军;勾学荣;;数据挖掘在移动客户流失预测中的研究和应用[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
10 孙义明;曾继东;;数据挖掘技术及其应用[A];全国计算机安全学术交流会论文集(第二十二卷)[C];2007年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
3 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
6 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
7 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
8 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
9 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
10 ;数据挖掘阻止银行客户流失[N];计算机世界;2007年
中国博士学位论文全文数据库 前10条
1 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
2 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
3 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
4 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
5 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
6 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
7 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
8 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
9 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 吕亚兵;WEB站点日志数据挖掘的研究与实现[D];武汉理工大学;2006年
2 闫永权;基于频繁访问模式树的Web使用挖掘研究[D];湖南大学;2006年
3 彭建光;数据挖掘技术在网站个性化推荐中的应用[D];上海交通大学;2007年
4 覃拥军;基于Web使用挖掘的用户模式识别研究[D];湖南师范大学;2008年
5 邹依依;自适应网站的Web挖掘技术的研究[D];电子科技大学;2008年
6 赵林明;基于数据仓库的信用卡数据挖掘研究[D];山东科技大学;2005年
7 陈骏武;基于数据挖掘技术的电信客户关系管理研究[D];湖南大学;2005年
8 房静;面向CRM的数据挖掘在电力市场营销中的应用[D];天津大学;2004年
9 罗国甫;数据挖掘在银行客户经理考核系统中的应用[D];同济大学;2006年
10 王鑫;数据挖掘中聚类分析算法的研究[D];山东师范大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026