收藏本站
《华中师范大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

序列模式的增量式挖掘算法研究

金灿  
【摘要】:随着信息技术的发展,许多领域积累了大量的数据,迫切需要一种技术从中及时发现有用的知识,提高信息利用率,KDD技术应运而生。通常KDD包括数据准备、数据挖掘、解释与评价等步骤。其中数据挖掘是KDD的核心环节。目前,数据挖掘的研究主要集中在分类、关联规则、序列模式挖掘等方面。 序列模式挖掘作为数据挖掘领域的研究热点之一,其任务是从序列数据库中挖掘出最大频繁序列供决策者做出决策。目前的挖掘算法主要分为两种,即一般的挖掘算法和增量式的挖掘算法。一般的挖掘算法如AprioriAll等以关联规则挖掘的相关算法为基础,当大型数据库需要加入新的数据时需要重新挖掘,降低了挖掘的效率,不能满足要求。于是序列模式的增量式挖掘算法被提出,现有的算法有MFS、ISM、ISE、IUS等,它们在原有数据库挖掘结果的基础上,往往只需遍历新增加的数据,或者只需较少次数的遍历原有数据库就能挖掘出新的序列模式,提高了挖掘的效率,其中IUS算法是最为先进的算法。 本文通过对IUS及其它算法的研究,发现这些算法往往都只考虑了向数据库中增加数据的情况,而很少有考虑大型数据库也有删除数据的情况,这是问题一。而且,这些算法都是基于“数据库的更新”,没有考虑到增量式挖掘的另一情况“算法参数的改变”,这是问题二。本文首先改正了IUS算法中的错误之处,然后分别针对这两个问题,结合序列模式的增量式挖掘算法的设计原则,以IUS算法为基础,提出了一种序列模式的更新式算法USP(Updating Sequential Patterns)用来解决问题一。该算法以原数据库的挖掘结果为基础,同时考虑添加和删除数据两种情况,选出其中符合条件的序列作为新数据库中的频繁序列和负边界序列,并在原频繁序列和加入数据库的频繁序列中产生新的序列,作为下一次的候选序列。提出CMS算法解决问题二,在不同的条件下,利用前次挖掘的结果加速本次挖掘过程。最后本文通过对这斜改进算法的分析,指出了它们不同于其它各种算法,以及比其它算法更完善和有效之处。
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:TP311.13

【相似文献】
中国期刊全文数据库 前10条
1 任家东;宗俊省;;一种基于规则表达式约束的序列模式增量式挖掘算法[J];燕山大学学报;2007年05期
2 铁治欣;俞瑞钊;;一种挖掘关联规则的高效增量式更新算法[J];浙江理工大学学报;2008年02期
3 刘佳新;严书亭;任家东;;缩减投影数据库规模的增量式序列模式算法[J];计算机工程;2012年03期
4 师富杲;杨凤杰;;基于多级加权更新关联规则的挖掘算法[J];计算机工程与应用;2009年07期
5 温蕴;;一种基于阈值变化的增量式更新算法研究[J];计算机科学;2008年08期
6 崔新春,韩莉莉;多层次模糊关联规则挖掘算法[J];计算机工程与应用;2004年10期
7 朱玉全;吕晓;陈耿;;频繁闭项目集更新算法[J];江苏大学学报(自然科学版);2008年04期
8 任家东;周晓磊;;一种挖掘序列模式的增量式更新算法[J];燕山大学学报;2007年06期
9 王慧芳;黄林鹏;俞晟;;一种增量式的社区发现算法研究[J];计算机仿真;2008年01期
10 邹翔,张巍,蔡庆生,王清毅;大型数据库中的高效序列模式增量式更新算法[J];南京大学学报(自然科学版);2003年02期
中国重要会议论文全文数据库 前10条
1 张琪;朱秋云;朱绍文;姬朝阳;魏苑琦;陈亮;;对一种序列模式的增量式算法的改进[A];2005年中国智能自动化会议论文集[C];2005年
2 金文;钱卫宁;周傲英;施伯乐;;一种新颖、高效、基于综合因素的聚类算法[A];第十六届全国数据库学术会议论文集[C];1999年
3 周龙;霍婷婷;;蚁群算法的发展及应用现状[A];第三届中国智能计算大会论文集[C];2009年
4 徐一;杨静;任志刚;杨迅幸;;基于学习的烟花算法[A];2018中国自动化大会(CAC2018)论文集[C];2018年
5 熊薇薇;吴怀宇;;一种改进的角点检测算法[A];中国计量协会冶金分会2009年年会论文集[C];2009年
6 陶丽;张自力;丁晓明;;一种适用于动态重构的联盟形成算法[A];2008年计算机应用技术交流会论文集[C];2008年
7 张兰平;;谈小学一年级算法多样化的优化[A];中华教育理论与实践科研论文成果选编(下)[C];2007年
8 杨红斌;;计划量算法的优化[A];第四届全国医院药剂科建设与管理学术研讨会论文集[C];2012年
9 林克旺;;基于分层网络实现高效的自稳定的选举算法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(下册)[C];2006年
10 徐英钟;高震;李波;;基于禁忌搜索的蚁群算法求解旅行商问题[A];第四届中国智能计算大会论文集[C];2010年
中国重要报纸全文数据库 前10条
1 眉间尺;比算法推荐更重要的是确认眼神[N];科技日报;2018年
2 陈航辉;切勿陷入算法迷信[N];解放军报;2019年
3 西南政法大学行政法学院 邬蕾;算法与法秩序的重塑[N];中国社会科学报;2019年
4 曾子林 邹力;谨防智能化作战的算法误区[N];解放军报;2019年
5 吴学安;要注意算法中存在的法律隐患[N];中国审计报;2019年
6 沈东坡;致命的“算法”[N];滨海时报;2017年
7 刘振;“成于算法”当警惕“败于算法”[N];安徽日报;2018年
8 中国信息通信研究院产业与规划研究所 李曼 谢智刚;算法升级加快数字经济发展步伐[N];人民邮电;2018年
9 孙益武;算法也应接受法律的审视[N];民主与法制时报;2018年
10 刘文龙;“算法”只是工具 可以运用但别依赖[N];解放日报;2018年
中国博士学位论文全文数据库 前10条
1 王冰;人工蜂群算法的改进及相关应用的研究[D];北京理工大学;2015年
2 王艳娇;人工蜂群算法的研究与应用[D];哈尔滨工程大学;2013年
3 李美安;普适分布式互斥算法及应用[D];电子科技大学;2007年
4 王小根;粒子群优化算法的改进及其在图像中的应用研究[D];江南大学;2009年
5 孙岩;贝叶斯网络结构学习算法研究与应用[D];大连理工大学;2010年
6 刘婷;改进人工蜂群算法及其在多用户检测中的应用[D];天津大学;2013年
7 邱剑锋;人工蜂群算法的改进方法与收敛性理论的研究[D];安徽大学;2014年
8 肖建元;保几何结构算法在等离子体物理中的应用[D];中国科学技术大学;2017年
9 盛歆漪;粒子群优化算法及其应用研究[D];江南大学;2015年
10 张冬丽;人工蜂群算法的改进及相关应用研究[D];燕山大学;2014年
中国硕士学位论文全文数据库 前10条
1 金灿;序列模式的增量式挖掘算法研究[D];华中师范大学;2004年
2 涂明;关联规则增量式更新算法研究[D];合肥工业大学;2010年
3 唐怀钰;一种KDD算法及其应用研究[D];电子科技大学;2005年
4 李娜;形式概念分析中若干算法的改进与实现[D];中央民族大学;2007年
5 王萌;基于粗糙集的聚类算法及应用研究[D];广西大学;2008年
6 倪国元;基于模糊聚类的增量式挖掘算法研究[D];华中科技大学;2004年
7 熊金芬;一种高效频繁项集挖掘算法的研究[D];哈尔滨工程大学;2006年
8 周雯;自适应聚类算法及其应用技术的研究与实现[D];中国人民解放军国防科学技术大学;2003年
9 马飞;数据挖掘中的聚类算法研究[D];南京理工大学;2008年
10 王蕴;基于量子理论的聚类算法研究[D];浙江工业大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026