收藏本站
《吉林大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

序列模式挖掘算法研究

管恩政  
【摘要】:数据挖掘,也可以称为数据库中的知识发现,是从大量数据中提取出可信、新颖、有效并能被人理解的模式的高级处理过程。序列模式挖掘(Sequential Pattern Mining)是指挖掘基于时间或者其它顺序的出现频率高的模式。传统的序列模式挖掘算法当从序列数据库中挖掘长模式或支持度较低时,存在所挖出的频繁子序列个数会随模式长度增加而爆炸性增长,以及在处理过程中可能遇到很高的计算复杂度等等方面的问题。 为此本文提出了三个新算法:EFSPAN,FFSPAN 和MFSPAN。算法EFSPAN 采用了深度优先挖掘策略,并将基于前缀序列格的深度优先遍历与两种高效的剪枝策略相结合。算法FFSPAN 则是通过在序列数据库中寻找一个频繁项或频繁项集来代替寻找一个完整的频繁序列,并且每次扫描的数据库都在不断迅速地减小。算法MFSPAN 挖掘最大频繁模式,它充分利用不同序列可能具有相同前缀的性质来减少项集比较次数。在标准测试数据集上的实验结果表明了它们都是非常有效的。
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP311.13

【引证文献】
中国博士学位论文全文数据库 前1条
1 刘维;生物序列模式挖掘与识别算法的研究[D];南京航空航天大学;2010年
中国硕士学位论文全文数据库 前4条
1 逯楠楠;数据库安全审计分析技术研究与应用[D];湖北工业大学;2011年
2 苏纯;基于树结构的生物数据挖掘算法的研究与实现[D];哈尔滨工业大学;2006年
3 胥春艳;序列模式挖掘算法研究及其在业务流程设计中的应用[D];天津大学;2007年
4 刘鑫;重复代码检测方法及其应用[D];哈尔滨工业大学;2007年
【同被引文献】
中国期刊全文数据库 前10条
1 管恩政,周春光,王喆,徐秀娟;频繁序列模式挖掘算法[J];吉林大学学报(信息科学版);2005年03期
2 张敏;生物序列比对算法研究现状与展望[J];大连大学学报;2004年04期
3 马旭辉;张阿红;;由FP树生成关联规则的深度优先算法研究[J];电脑知识与技术;2010年13期
4 李天瑞,潘无名,杨宁,徐扬;序列模式的性质研究[J];复旦学报(自然科学版);2004年05期
5 胡锦美;基于树与链表的关联规则增量更新的实现[J];闽江学院学报;2005年05期
6 史庆伟;赵政;鲍虎;;基于条件随机域的Web信息抽取[J];辽宁工程技术大学学报;2007年04期
7 李建忠;刘建宾;;重复代码自动检测工具的研究与设计[J];韩山师范学院学报(自然科学);2006年06期
8 涂俐兰,王能超;DNA序列拼接中重复序列屏蔽的一种新方法[J];华中科技大学学报(自然科学版);2004年08期
9 朱玉全,孙志挥,赵传申;快速更新频繁项集[J];计算机研究与发展;2003年01期
10 范明,李川;在FP-树中挖掘频繁模式而不生成条件FP-树[J];计算机研究与发展;2003年08期
中国博士学位论文全文数据库 前3条
1 刘亚波;关联规则挖掘方法的研究及应用[D];吉林大学;2005年
2 许孝元;分类关联规则归纳算法及应用研究[D];华南理工大学;2005年
3 马海兵;频繁模式挖掘相关技术研究[D];复旦大学;2005年
中国硕士学位论文全文数据库 前10条
1 陈黎;序列挖掘算法研究[D];重庆大学;2001年
2 刘恒;程序中重复代码的自动检测[D];大连理工大学;2003年
3 黄晶晶;基于分类频繁模式树的关联分类算法的研究与应用[D];河海大学;2005年
4 窦祥国;关联规则评价方法研究[D];合肥工业大学;2005年
5 孙莹;序列模式发现中关键问题的研究与实现[D];合肥工业大学;2005年
6 连洁;关联规则算法性能分析及改进[D];吉林大学;2005年
7 李建忠;重复代码检测技术的研究[D];汕头大学;2005年
8 刘乃丽;基于FP-树的关联规则挖掘算法的设计与实现[D];山东大学;2005年
9 顾泽元;关联规则数据挖掘频繁项目集发现算法的研究[D];哈尔滨工程大学;2005年
10 陈孝卫;数据挖掘技术在蛋白质二级结构预测中的应用研究[D];暨南大学;2005年
【二级引证文献】
中国期刊全文数据库 前2条
1 陈勇;;数据库安全与防范措施探析[J];计算机光盘软件与应用;2012年24期
2 王伟;苏小红;马培军;王甜甜;;标识符重命名不一致性缺陷的检测[J];哈尔滨工业大学学报;2011年01期
中国硕士学位论文全文数据库 前1条
1 朱红章;旅团级部队日常兵员管理系统的设计与实现[D];西北大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 李永忠;孙彦;罗军生;;WINEPI挖掘算法在入侵检测中的应用[J];计算机工程;2006年23期
2 刘俊侠;;使用有向图挖掘时间间隔序列模式[J];计算机科学与探索;2008年06期
3 黄小红;陈丽华;王倩;戴昕;;多属性约束事件序列的关联规则挖掘方法[J];微计算机信息;2009年03期
4 师鸣若;;基于邻接序列模式挖掘的网络流量分析[J];电脑开发与应用;2010年10期
5 汪永旗;张军;;序列模式挖掘在旅游行程分析中的应用研究[J];微计算机信息;2011年03期
6 周晔,杨天奇;一种基于置信度的异常检测模型与设计[J];计算机仿真;2005年01期
7 陶再平;俞瑞钊;;序列模式增量式更新的快速算法[J];计算机应用;2006年S2期
8 倪志伟;叶红云;曹欢欢;;基于均值约束满足度剪枝策略的高效序列模式挖掘算法[J];中国科学技术大学学报;2007年02期
9 吴楠;胡学钢;;基于PrefixSpan序列模式挖掘的一种改进算法[J];电脑知识与技术(学术交流);2007年20期
10 俞单庆;吉根林;;基于数据流的序列模式挖掘算法[J];江南大学学报(自然科学版);2007年06期
中国重要会议论文全文数据库 前10条
1 李润恒;贾焰;金鑫;;一种面向网络安全的序列模式挖掘方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 李晟;姜青山;郭顺;王备战;;一种优化的蛋白质序列模式挖掘方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 朱辉生;李存华;;序列模式挖掘的研究与实现[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 赵畅;杨冬青;唐世渭;郭迎春;;Web日志序列模式挖掘工具SPMiner的设计[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 牛兴雯;杨冬青;唐世渭;王腾蛟;;OSAF-tree——可迭代的移动序列模式挖掘及增量更新方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
6 任家东;解玉洁;何海涛;张爱国;;基于改进前缀树PStree的最大序列模式挖掘[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
7 刘琪;牛文静;顾兆军;;基于API调用序列的恶意代码动态分析方法研究[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
8 窦赫男;刘正捷;夏季;;序列模式挖掘在网站可用性分析研究上的应用[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国人机交互学术会议(CHCI'06)论文集[C];2006年
9 何星星;谢伙生;;流数据中一种高效剪枝的频繁序列挖掘算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
10 周涛;;基于数据挖掘的入侵检测日志分析技术研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年
中国重要报纸全文数据库 前1条
1 惠琳;数据挖掘 提升核心竞争力[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 谢飞;带有通配符的序列模式挖掘研究[D];合肥工业大学;2011年
2 杨钤雯;序列模式挖掘方法及Web使用挖掘研究[D];天津大学;2010年
3 刘维;生物序列模式挖掘与识别算法的研究[D];南京航空航天大学;2010年
4 兰秋军;金融时间序列隐含模式挖掘方法及其应用研究[D];湖南大学;2005年
5 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
6 金阳;基于概念格模型的序列模式挖掘算法研究[D];吉林大学;2007年
7 宋世杰;基于序列模式挖掘的误用入侵检测系统及其关键技术研究[D];国防科学技术大学;2005年
8 熊赟;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
9 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年
10 陆介平;描述性规则挖掘若干关键技术研究[D];东南大学;2006年
中国硕士学位论文全文数据库 前10条
1 王永强;基于DF2Ls的序列模式挖掘研究[D];兰州大学;2011年
2 任芳;时间序列数据挖掘研究[D];辽宁师范大学;2010年
3 魏龙;GML时空序列模式挖掘研究[D];江西理工大学;2011年
4 窦赫男;序列模式挖掘在网站可用性分析研究上的应用[D];大连海事大学;2006年
5 祝效普;WEB用户访问序列模式挖掘[D];天津大学;2005年
6 梁伟;Web使用挖掘在电子商务推荐系统中的应用研究[D];天津大学;2004年
7 管恩政;序列模式挖掘算法研究[D];吉林大学;2005年
8 仇大伟;基于序列数据库的数据挖掘系统的设计和研究[D];山东科技大学;2005年
9 郭跃斌;基于序列模式的正负关联规则挖掘技术[D];山东轻工业学院;2008年
10 刘磊;基于序列模式挖掘的入侵检测算法的研究[D];中国科学技术大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026