收藏本站
《电子科技大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

面向网络用户行为模式发现的数据挖掘技术探索

李亭枫  
【摘要】: 自20世纪90年代以来,随着信息技术的高速发展,互联网在人们日常生活和工作中的地位越来越重要。广阔的互联网给人们带来丰富信息资源的同时,也带来了巨大的商机。各种互联网服务和电子商务活动都取得了巨大的进展。用户的需求就是商机,如何从用户在Web服务器上留下的访问信息中找出用户访问行为的规律和模式,成为电子商务服务提供者和数据挖掘研究者关注的焦点,由此产生了对Web日志挖掘技术的研究工作。 本文主要的研究内容是Web日志挖掘中关键步骤的理论和算法改进问题,并针对实例数据对改进的方法进行验证。Web日志挖掘过程中数据预处理工作和模式挖掘工作是两个最主要的阶段。本文首先详细的就数据预处理阶段的各个处理环节进行研究分析,对每个环节的处理原则进行了总结,提出了相应的处理机制和算法实现。重点就用户会话识别方法深入研究,针对目前常见的基于统一固定时间阈值的会话识别方法存在的无法适应页面访问多样性的问题,提出了创新的个性化时间阈值构成方法,并将其和页面引用方法相结合,给出了新的用户会话识别算法,然后通过实验对方法进行了验证。针对模式挖掘过程,本文主要研究从频繁序列模式挖掘的角度进行用户行为模式发现的方法。论文对频繁序列发现的过程进行了分析,从关联规则挖掘算法Apriori出发,重点研究了对该算法进行修改从而应用到频繁序列模式挖掘过程的改进算法。在研究分析该算法执行过程和性能特点的基础上指出了算法存在的缺陷和不足。针对挖掘结果过于冗余的问题,提出了新的改进思路,即引入多重因子约束的方法对挖掘过程进行修正,过滤低价值的访问路径。文章研究并提出了相关因子的构造方法,给出了改进方法的算法实现,并通过实验对比,对算法的优化改进效果进行了验证。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP311.13

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 王红侠;胡学钢;;基于Bitmap的序列模式挖掘的改进算法[J];计算机技术与发展;2007年08期
2 徐涛;;带兴趣度的序列概念格的最大模式挖掘[J];科技信息;2010年14期
3 胡学钢;张圆圆;;一种挖掘带时间约束序列模式的改进算法[J];智能系统学报;2007年02期
4 黄小红;陈丽华;王倩;戴昕;;多属性约束事件序列的关联规则挖掘方法[J];微计算机信息;2009年03期
5 赵峰;李庆华;;基于可信推断的流数据序列模式分析算法[J];小型微型计算机系统;2006年07期
6 李超锋;卢炎生;;Web使用挖掘技术分析[J];计算机科学;2006年02期
7 石杰;马骋;王铮;;Web挖掘技术及其在教育中的应用[J];科技创新导报;2008年34期
8 金阳;左万利;;多维概念格与多维序列模式的增量挖掘[J];计算机研究与发展;2007年11期
9 李永忠;孙彦;罗军生;;WINEPI挖掘算法在入侵检测中的应用[J];计算机工程;2006年23期
10 刘俊侠;;使用有向图挖掘时间间隔序列模式[J];计算机科学与探索;2008年06期
中国重要会议论文全文数据库 前10条
1 李润恒;贾焰;金鑫;;一种面向网络安全的序列模式挖掘方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 李晟;姜青山;郭顺;王备战;;一种优化的蛋白质序列模式挖掘方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 朱辉生;李存华;;序列模式挖掘的研究与实现[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 赵畅;杨冬青;唐世渭;郭迎春;;Web日志序列模式挖掘工具SPMiner的设计[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 牛兴雯;杨冬青;唐世渭;王腾蛟;;OSAF-tree——可迭代的移动序列模式挖掘及增量更新方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
6 任家东;解玉洁;何海涛;张爱国;;基于改进前缀树PStree的最大序列模式挖掘[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
7 刘怡;郝云飞;许洁萍;;乐曲近似重复模式的发现及其在音乐数据库检索算法中的应用[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
8 陈增强;陈轶迪;袁著祉;张建华;;自组织特征映射神经网络在图书销售分析中的应用[A];2005中国控制与决策学术年会论文集(下)[C];2005年
9 于升峰;;WEB使用挖掘的模式发现[A];信息时代——科技情报研究学术论文集(第二辑)[C];2006年
10 习慧丹;;Web日志挖掘探析[A];第三届全国软件测试会议与移动计算、栅格、智能化高级论坛论文集[C];2009年
中国重要报纸全文数据库 前2条
1 惠琳;数据挖掘 提升核心竞争力[N];首都建设报;2009年
2 本报记者 赵英明;58%的门票收入增幅是怎样实现的[N];济南日报;2011年
中国博士学位论文全文数据库 前10条
1 杨钤雯;序列模式挖掘方法及Web使用挖掘研究[D];天津大学;2010年
2 谢飞;带有通配符的序列模式挖掘研究[D];合肥工业大学;2011年
3 刘维;生物序列模式挖掘与识别算法的研究[D];南京航空航天大学;2010年
4 兰秋军;金融时间序列隐含模式挖掘方法及其应用研究[D];湖南大学;2005年
5 黄芹华;隐私保持数据挖掘与知识发现研究[D];上海大学;2007年
6 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
7 宋世杰;基于序列模式挖掘的误用入侵检测系统及其关键技术研究[D];国防科学技术大学;2005年
8 金阳;基于概念格模型的序列模式挖掘算法研究[D];吉林大学;2007年
9 李冬冬;基因组序列标注的算法与理论研究[D];国防科学技术大学;2004年
10 熊赟;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
中国硕士学位论文全文数据库 前10条
1 王永强;基于DF2Ls的序列模式挖掘研究[D];兰州大学;2011年
2 李亭枫;面向网络用户行为模式发现的数据挖掘技术探索[D];电子科技大学;2010年
3 孙莹;序列模式发现中关键问题的研究与实现[D];合肥工业大学;2005年
4 张圆圆;序列模式发现模型的研究[D];合肥工业大学;2007年
5 任芳;时间序列数据挖掘研究[D];辽宁师范大学;2010年
6 王红侠;基于分布式概念格的序列模式发现研究[D];合肥工业大学;2007年
7 陈景强;序列模式挖掘在Web日志挖掘中应用研究[D];重庆大学;2008年
8 魏龙;GML时空序列模式挖掘研究[D];江西理工大学;2011年
9 窦赫男;序列模式挖掘在网站可用性分析研究上的应用[D];大连海事大学;2006年
10 祝效普;WEB用户访问序列模式挖掘[D];天津大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026