收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

一般周期间隙约束的序列模式挖掘

周坤  
【摘要】:序列模式挖掘能够有效地挖掘到序列中的出现频率高的模式,从而在诸多领域中具有广泛的应用。假定子模式pi和pj可以分别匹配事件A和事件B,如果ij,传统的序列模式挖掘方法能够对事件A在事件B之后的序列进行检测,而不能对事件B发生在事件A之前的序列进行识别。这样由于序列的有序性,因而挖掘的模式必然是有序的频繁模式,然而这种情况在实际中有时不是很合理。有鉴于此,我们研究了周期性一般间隙约束的序列模式挖掘问题。本文的研究内容和相关工作如下:1.提出了一般周期间隙约束的序列模式挖掘问题,并给出了该问题的严格定义。由于周期间隙约束的序列模式挖掘会导致不满足Apriori性质的现象,我们对偏移序列的定义做了适当调整,使得该问题满足Apriori性质。2.在多序列挖掘中采用新的模式频繁的判定方式。在序列数据库上进行挖掘时,传统的模式支持数计算方式是包含该模式的序列的个数,这种判定方式存在不合理的地方,模式在一个序列中的频繁度只记为1,不能体现模式在数据库序列中的频繁性。然而如果直接采用模式出现的总个数作为模式的频繁度数量又太大,因此我们采用支持率的判定方式,即计算模式在每个序列中的支持数的和和偏移序列数的和,如果两者的比值大于阈值,那么该模式就是频繁的。3.建立有效地挖掘算法。由于一棵不完整网树(即网树的最后一层结点,可以存储在一个数组中)可以有效地表示一个模式在一个序列中的出现位置和支持数,因此模式在整个序列中的出现位置及支持数可以用不完整网树森林来表示。本文采用深度优先的方式进行序列模式挖掘,即在一遍扫描序列数据库的情况下,建立其所有超模式的不完整网树森林,并对这些超模式的支持率进行有效地计算,将频繁的超模式和其不完整网树森林压入堆栈,然后从栈顶弹出元素继续上述过程直到栈空为止,该方法有效地提高了序列模式挖掘速度。4.选取有代表性的数据集和对比算法,设计了大量的对比实验,从算法的挖掘结果和挖掘效率两方面对实验结果进行了分析,验证了本文算法的有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 龚惠群,黄超,彭江平;具有双时间维约束的股票序列模式挖掘[J];计算机工程;2003年20期
2 许兆新,郝燕玲;约束在序列模式挖掘中的应用研究[J];计算机工程与应用;2004年05期
3 马帅,唐世渭,杨冬青,王腾蛟,高军;移动环境中的最大移动序列模式挖掘(英文)[J];北京大学学报(自然科学版);2004年03期
4 孙晓冬;一种基于χ~2测试的序列模式挖掘算法[J];辽宁大学学报(自然科学版);2004年02期
5 祝效普,梁洪峻;序列模式挖掘在网络业务流分析中的应用[J];计算机应用;2004年08期
6 管恩政,周春光,王喆,徐秀娟;频繁序列模式挖掘算法[J];吉林大学学报(信息科学版);2005年03期
7 夏明波;王晓川;孙永强;金士尧;;序列模式挖掘算法研究[J];计算机技术与发展;2006年04期
8 姜晚云;胡学钢;;序列模式挖掘及其算法的研究[J];科技经济市场;2006年01期
9 孙蕾;朱玉全;;频繁序列模式挖掘中关键技术的研究[J];计算机工程;2006年11期
10 任家东;宗俊省;李志国;;一种实现偏序约束条件下的序列模式挖掘算法[J];计算机工程与科学;2007年05期
11 景波;刘莹;黄兵;;基于序列模式挖掘的隐私保护[J];计算机工程与应用;2007年22期
12 胡孔法;张长海;陈崚;宋爱波;达庆利;;分布式环境下全局序列模式挖掘技术研究[J];计算机集成制造系统;2007年11期
13 王红侠;胡学钢;;基于分布式概念格的序列模式挖掘[J];合肥学院学报(自然科学版);2007年04期
14 蔡静;;序列模式挖掘导引[J];科技信息(科学教研);2007年36期
15 魏伟杰;张明卫;张斌;王波;;基于最小加权支持的加权序列模式挖掘算法[J];吉林大学学报(工学版);2008年S2期
16 彭弗楠;陈未如;黄宁;;结构关系模式挖掘中的重复序列模式挖掘[J];甘肃科技;2008年08期
17 贺桂娇;;一种改进的序列模式挖掘算法[J];电脑知识与技术;2008年S1期
18 常鹏;陈耿;朱玉全;;一种分布式序列模式挖掘算法[J];计算机应用;2008年11期
19 夏岩;倪世宏;王彦鸿;;动态划分序列模式挖掘算法[J];计算机仿真;2009年02期
20 田卫东;姜海辉;;一种有效的并行序列模式挖掘算法[J];计算机工程;2009年18期
中国重要会议论文全文数据库 前10条
1 吕静;陈未如;刘俊;Osei Adjei;;并发分支模式挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 端义锋;胡谷雨;丁力;;序列模式挖掘在网络告警分析中的应用[A];2004年全国通信软件学术会议论文集[C];2004年
3 朱辉生;李存华;;序列模式挖掘的研究与实现[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 程银波;司菁菁;;带有间隔约束的序列模式挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
5 李润恒;贾焰;金鑫;;一种面向网络安全的序列模式挖掘方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
6 李晟;姜青山;郭顺;王备战;;一种优化的蛋白质序列模式挖掘方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
7 姚伟力;王锡禄;宋俊德;;基于序列模式挖掘的告警相关性分析算法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
8 任家东;解玉洁;何海涛;张爱国;;基于改进前缀树PStree的最大序列模式挖掘[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
9 牛兴雯;杨冬青;唐世渭;王腾蛟;;OSAF-tree——可迭代的移动序列模式挖掘及增量更新方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
10 张锐;熊赟;陈越;朱扬勇;;MS-BioSM:一个基于多支持度生物序列模式挖掘算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
中国博士学位论文全文数据库 前7条
1 金阳;基于概念格模型的序列模式挖掘算法研究[D];吉林大学;2007年
2 谢飞;带有通配符的序列模式挖掘研究[D];合肥工业大学;2011年
3 熊赟;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
4 杨钤雯;序列模式挖掘方法及Web使用挖掘研究[D];天津大学;2010年
5 陆介平;描述性规则挖掘若干关键技术研究[D];东南大学;2006年
6 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年
7 徐前方;基于数据挖掘的网络故障告警相关性研究[D];北京邮电大学;2007年
中国硕士学位论文全文数据库 前10条
1 张长海;分布式序列模式挖掘算法研究[D];扬州大学;2008年
2 陈晓;基于模糊集的序列模式挖掘研究[D];天津大学;2007年
3 俞单庆;序列模式挖掘及其在入侵检测中的应用研究[D];南京师范大学;2008年
4 姜海辉;并行序列模式挖掘关键问题研究[D];合肥工业大学;2009年
5 刘磊;基于序列模式挖掘的入侵检测算法的研究[D];中国科学技术大学;2009年
6 吴永俊;序列模式挖掘研究[D];安徽大学;2010年
7 陈晶;基于序列模式挖掘算法的入侵检测研究[D];华东师范大学;2011年
8 赵鲁麟;负序列模式挖掘技术的研究[D];山东轻工业学院;2011年
9 董圆;基于前缀树的并行序列模式挖掘算法研究[D];燕山大学;2011年
10 宗俊省;基于约束的序列模式挖掘算法的研究[D];燕山大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978