收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于Web日志的序列模式挖掘算法的研究

王晓雪  
【摘要】: 随着信息时代的来临,人们越来越依赖来自网络中的信息,同时对信息搜索技术的准确率的要求也越来越高。然而,由于网络中的信息量呈爆炸式增长,并且还包括各种虚假,不相关等的信息垃圾,无形中给用户的访问造成了极大困扰。于是如何在有效时间内找到用户真正需要的信息,成为了当前Web日志挖掘研究领域的热点问题。而其中序列模式挖掘则是作为较为重要的Web日志挖掘技术的一个重要研究分支,越来越被学者们关注。 近年来很多学者针对搜索技术提出了效率较高,符合用户需求的序列模式挖掘算法。序列模式挖掘技术具有广泛的实际应用价值,它可以在具有序列特征的数据上进行挖掘,找到满足用户需求的潜在模式,商业用户通过分析这些模式进行策略或者结构上的改进措施,以达到他们不同的目的,如提高服务质量或者提高个性化服务等。比如,序列模式挖掘在商业领域中被网站用来进行用户访问模式挖掘,网络超市用这个技术来进行用户购买行为预测等,生物学家用它来进行生物DNA序列挖掘等。因此,序列模式挖掘技术研究具有重要的实际意义。 本文主要的研究工作是在Apriori算法基础上,利用SPADE算法存储策略,来简化连接和测试过程,同时为了提高算法效率,也为了使挖掘结果更加符合用户需求,在Apriori算法上添加能够反映用户需求的时间约束。Apriori算法具有的突出问题是:扫描数据库次数多,搜索空间大,产生大量的候选集。 所以本文通过添加时间约束对Apriori算法进行改进,希望能达到缩小搜索空间,减少候选集和找到满足用户需求的模式的目的。同时为了缩小算法执行过程中占用的内存,本文提出了一个五元组存储策略,这样同时也能够简化搜索过程。虽然添加了时间约束,会增加算法的复杂度,但改进后的算法在整体上效率还是有所提高的。本文充分考虑了改进算法的运行效率,能达到较好的准确率及召回率,并借鉴其他通过时间约束进行改进的算法,实现了本文的挖掘算法,取得了一定的挖掘效果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 龚惠群,黄超,彭江平;具有双时间维约束的股票序列模式挖掘[J];计算机工程;2003年20期
2 郭跃斌;翟延富;董祥军;;序列模式的关联规则在彩票分析中的应用研究[J];山东轻工业学院学报(自然科学版);2008年01期
3 周斌,吴泉源,高洪奎;序列模式挖掘的增量式算法的设计原则[J];计算机研究与发展;2000年10期
4 王红侠;胡学钢;;基于可信度约束的序列模式发现研究[J];淮北煤炭师范学院学报(自然科学版);2008年01期
5 贺桂娇;;一种改进的序列模式挖掘算法[J];电脑知识与技术;2008年S1期
6 周斌,吴泉源;序列模式挖掘的一种渐进算法[J];计算机学报;1999年08期
7 王兴鹏,沙金;利用Apriori算法进行序列模式挖掘[J];现代计算机;2002年10期
8 邹翔,张巍,蔡庆生,王清毅;大型数据库中的高效序列模式增量式更新算法[J];南京大学学报(自然科学版);2003年02期
9 马传香;李庆华;简钟;;MAXSeq:一个新的最大频繁序列挖掘算法[J];小型微型计算机系统;2006年06期
10 吴卫华,袁宁;基于序列模式的关联规则Apriori算法的研究与优化[J];山东机械;2003年05期
11 宋世杰,胡华平,胡笑蕾;关联规则和序列模式算法在入侵检测系统中的应用[J];成都信息工程学院学报;2004年01期
12 赵晨;诸静;;复杂系统控制对象之间耦合关联度的数据挖掘[J];电气自动化;2003年06期
13 孙晓冬;一种基于χ~2测试的序列模式挖掘算法[J];辽宁大学学报(自然科学版);2004年02期
14 杨学兵,刘胜军,蔡庆生;一种实时过程控制中的数据挖掘算法研究[J];计算机应用;1999年09期
15 陈金玉,樊兴华,曹长修;序列模式的一种挖掘算法[J];重庆大学学报(自然科学版);2001年01期
16 吴卫华,袁宁;地理信息关联规则挖掘算法的设计与应用[J];山东国土资源;2003年04期
17 刘旭,祁之力,谭立刚;一种基于灰关联的序列模式挖掘算法[J];北京邮电大学学报;2003年03期
18 赵永进,王世卿;关联规则在股票分析中的应用研究[J];微机发展;2005年09期
19 郭跃斌;翟延富;董祥军;杨越越;李刚;;基于序列模式的正负关联规则研究[J];山东大学学报(理学版);2007年09期
20 胡笑蕾,胡华平,宋世杰;数据挖掘算法在入侵检测系统中的应用[J];计算机应用研究;2004年07期
中国重要会议论文全文数据库 前10条
1 程银波;司菁菁;;带有间隔约束的序列模式挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
2 冯迪;李晋宏;曹原;;基于网页的数据挖掘研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
3 童咏昕;张媛媛;袁玫;马世龙;于丹;赵莉;;一种挖掘压缩序列模式的有效算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
4 张琪;朱秋云;朱绍文;姬朝阳;魏苑琦;陈亮;;对一种序列模式的增量式算法的改进[A];2005年中国智能自动化会议论文集[C];2005年
5 石晶;龚震宇;裘杭萍;;基于Web挖掘的个性化服务技术[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
6 李利波;刘明利;;一种改进的无回溯反向Web服务动态组合方法[A];2011年全国通信安全学术会议论文集[C];2011年
7 游争光;刘建勋;唐明董;;分布式Web服务测试系统的设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
8 殷华蓓;李通;唐常杰;张天庆;左志松;;从Web文件中挖掘个性化导航知识[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
9 ;基于广义对话的Web用户的聚类(英文)[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
10 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
中国博士学位论文全文数据库 前10条
1 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
2 汤春蕾;交易序列数据挖掘研究[D];复旦大学;2011年
3 黄发良;Web信息网络社区挖掘的关键技术研究[D];华南理工大学;2011年
4 张榛楠;面向电子商务的Web使用挖掘关键技术研究[D];中国矿业大学(北京);2009年
5 李常宝;基于索引的web服务发现研究[D];北京邮电大学;2011年
6 魏登萍;语义Web服务发现中匹配策略的研究与实现[D];国防科学技术大学;2011年
7 张建武;面向Web应用的安全评测技术研究[D];北京邮电大学;2012年
8 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
9 陈世展;服务网络:基于语义和社会化关系的Web服务计算基础设施[D];天津大学;2010年
10 朱俊武;基于本体的Web服务语义支撑技术研究[D];南京航空航天大学;2008年
中国硕士学位论文全文数据库 前10条
1 王晓雪;基于Web日志的序列模式挖掘算法的研究[D];东北师范大学;2010年
2 李建芳;基于关联规则及序列模式的Web日志挖掘系统[D];解放军信息工程大学;2009年
3 王慧;Web日志中用户频繁访问路径挖掘算法的研究[D];北京交通大学;2011年
4 朱秀云;基于Web挖掘技术研究及其在数字图书馆中的应用[D];辽宁科技大学;2012年
5 王伟娜;基于投影位置的序列模式挖掘算法研究与应用[D];广西大学;2012年
6 伯明超;基于序列模式的Web挖掘的研究[D];长春理工大学;2012年
7 段利君;基于Web挖掘的网页动态推荐系统研究[D];复旦大学;2010年
8 徐海兰;Web日志挖掘技术在个性化信息推荐中的应用[D];延边大学;2009年
9 公伟;序列模式挖掘算法及其在云取证中的应用研究[D];山东师范大学;2012年
10 李明月;基于约束的闭序列模式挖掘算法的研究[D];燕山大学;2012年
中国重要报纸全文数据库 前10条
1 赵晓涛;Web安全 服务为王[N];网络世界;2008年
2 本报记者 赵晓涛;Web安全:历史的命题[N];网络世界;2008年
3 彭敏;企业级Web2.0迎来应用高潮[N];电脑商报;2009年
4 本报记者 毛江华;安启华联手赛门铁克 掘金Web安全[N];计算机世界;2009年
5 闫冰;“推”出Web交付新天地[N];网络世界;2009年
6 赵晓涛;中国成全球Web安全新看点[N];网络世界;2009年
7 边歆;动态阻断Web2.0威胁[N];网络世界;2009年
8 泰乐公司首席技术官兼执行副总裁Vikram Saksena;学习Web 3.0 做聪明的“管道工”[N];通信产业报;2009年
9 ;Web2.0工具使用须谨慎[N];网络世界;2009年
10 Anchiva中国区总经理 李松;Web安全选型三个标准[N];网络世界;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978