收藏本站
《燕山大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于前缀树的并行序列模式挖掘算法研究

董圆  
【摘要】:序列模式挖掘已成为数据挖掘领域一个重要的研究课题,广泛的应用于DNA序列分析、WEB访问模式的预测、自然灾害预测等领域。所谓序列模式挖掘是指从序列数据库中寻找频繁子序列作为模式的知识发现过程。而近年来结合并行技术的序列模式的并行化挖掘越来越受到研究者的重视。但缺乏有效的挖掘算法和剪枝策略,处理器之间的通信开销大以及负载不均衡,这些都是并行序列模式挖掘需要解决的几个关键问题。 本文分析了几种典型的并行序列模式挖掘算法的优缺点,针对并行序列挖掘中缺乏高效挖掘算法和剪枝策略问题,提出了基于前缀树的非闭合并行序列模式挖掘算法。此算法采用一种类似前缀树的结构,以prefixspan算法为基础挖掘局部序列和全局序列,并提出了一种新的前缀树剪枝技术将不能扩展的全局k序列删除来提高挖掘效率。 由于序列模式挖掘将会产生大量的候选序列,为了减少挖掘过程中产生的候选序列,首先,采用挖掘闭合模式取代一般的频繁模式;其次,针对闭合序列模式挖掘中的闭合检测问题,以BIDE算法为基础,通过Backscan技术将确定不会产生闭合序列的序列提前剪枝;最后,针对并行挖掘中容易出现的负载不平衡问题,本文提出了一种新的“就近申请”的动态负载平衡机制。 本文使用C++语言和MPICH并行编程环境实现了这些算法,在不同的实验数据上进行测试,并分析了算法在各方面的性能表现以及仍然存在的问题。
【学位授予单位】:燕山大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP311.13

【相似文献】
中国期刊全文数据库 前10条
1 刘洪辉;吴岳芬;;用户行为模式挖掘问题的研究[J];计算机技术与发展;2006年05期
2 刘洪辉;;一种用户行为模式的挖掘算法[J];计算机工程;2006年16期
3 吕橙;张兵;;序列模式挖掘的两种典型算法及比较[J];湖北师范学院学报(自然科学版);2006年04期
4 李永忠;孙彦;罗军生;;WINEPI挖掘算法在入侵检测中的应用[J];计算机工程;2006年23期
5 刘俊侠;;使用有向图挖掘时间间隔序列模式[J];计算机科学与探索;2008年06期
6 黄小红;陈丽华;王倩;戴昕;;多属性约束事件序列的关联规则挖掘方法[J];微计算机信息;2009年03期
7 师鸣若;;基于邻接序列模式挖掘的网络流量分析[J];电脑开发与应用;2010年10期
8 汪永旗;张军;;序列模式挖掘在旅游行程分析中的应用研究[J];微计算机信息;2011年03期
9 周晔,杨天奇;一种基于置信度的异常检测模型与设计[J];计算机仿真;2005年01期
10 陶再平;俞瑞钊;;序列模式增量式更新的快速算法[J];计算机应用;2006年S2期
中国重要会议论文全文数据库 前1条
1 魏顺平;;教育数据挖掘:现状与趋势[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
中国重要报纸全文数据库 前1条
1 惠琳;数据挖掘 提升核心竞争力[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 刘维;生物序列模式挖掘与识别算法的研究[D];南京航空航天大学;2010年
2 杨钤雯;序列模式挖掘方法及Web使用挖掘研究[D];天津大学;2010年
3 兰秋军;金融时间序列隐含模式挖掘方法及其应用研究[D];湖南大学;2005年
4 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
5 宋世杰;基于序列模式挖掘的误用入侵检测系统及其关键技术研究[D];国防科学技术大学;2005年
6 金阳;基于概念格模型的序列模式挖掘算法研究[D];吉林大学;2007年
7 熊赟;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
8 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年
9 单莘;基于知识发现的告警相关性分析关键问题研究[D];北京邮电大学;2006年
10 陆介平;描述性规则挖掘若干关键技术研究[D];东南大学;2006年
中国硕士学位论文全文数据库 前10条
1 王永强;基于DF2Ls的序列模式挖掘研究[D];兰州大学;2011年
2 董圆;基于前缀树的并行序列模式挖掘算法研究[D];燕山大学;2011年
3 任芳;时间序列数据挖掘研究[D];辽宁师范大学;2010年
4 魏龙;GML时空序列模式挖掘研究[D];江西理工大学;2011年
5 解玉洁;基于树结构的精简序列模式挖掘算法研究[D];燕山大学;2010年
6 窦赫男;序列模式挖掘在网站可用性分析研究上的应用[D];大连海事大学;2006年
7 祝效普;WEB用户访问序列模式挖掘[D];天津大学;2005年
8 梁伟;Web使用挖掘在电子商务推荐系统中的应用研究[D];天津大学;2004年
9 管恩政;序列模式挖掘算法研究[D];吉林大学;2005年
10 仇大伟;基于序列数据库的数据挖掘系统的设计和研究[D];山东科技大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026