收藏本站
《东南大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

描述性规则挖掘若干关键技术研究

陆介平  
【摘要】: 描述性规则挖掘是数据挖掘研究领域的重要课题之一。数据挖掘的任务是从大量的数据中发现模式,按照其功能作用可分为预测性和描述性挖掘,描述性规则挖掘对数据中存在的规律、规则做出一种描述,它涵盖了数据挖掘中关联分析、序列模式发现等重要研究领域。 论文研究工作结合省知识产权平台建设工作,针对专利文献的挖掘和利用,在现有的描述性规则挖掘研究的基础上,针对描述性规则挖掘的实际需求和若干需要解决的关键技术,以关联规则分析为基础,对描述性规则挖掘中的序列模式挖掘技术、分布环境下关联规则快速挖掘技术以及基于关联分析的离群知识发现方法等进行研究。 针对序列模式挖掘过程本身是一个反复的交互式过程,提出了一种基于PrefixSpan的快速交互式序列模式挖掘算法,当最小支持度发生变化时,算法能够充分利用前次或中间结果,快速生成新的模式;结合序列模式的增量式更新问题,提出了基于投影数据库的序列模式增量式更新算法ISPMP,算法采用间接拼接的方法更新已经得到的序列,用增量数据库来减小投影数据库,从而有效提高算法效率;在此基础上,为了进一步提高序列模式挖掘的效率,提出了一种基于二进制形式的候选频繁序列模式生成和相应的计算支持数方法,该方法只需对挖掘对象进行一些“或”、“与”、“异或”、等逻辑运算操作,显著降低了候选频繁序列模式生成和相应的支持数计算的实现难度,将该方法与序列模式挖掘及更新算法相结合,可以有效提高序列模式挖掘及更新算法的效率;针对大数据集关联规则发现问题,提出了一种快速挖掘全局最大频繁项目集算法FMGMFI,该算法采用FP-tree存储结构,由于FP-tree结构是一种压缩的存储结构,数据库中的记录可被压缩存储在建立的局部FP-tree的各路经中,使得FMGMFI可方便地从各局部FP-tree的相关路径中得到项目集的支持度,同时采用自顶向下和自底向上的双向搜索策略,可有效地降低网络通讯代价,高效地生成关联规则;最后,针对现有离群点检测算法多数面向低维空间数据,并且缺少语义解释的问题,结合关联分析及粗糙集知识提出了一种基于关联分析的离群点检测算法,算法可以有效发现存在于大量数据集中有别于正常关联模式的那些异常数据点。 在论文的研究过程中,针对所提出各种算法进行了大量的实验验证,实验结果表明了算法的合理性和有效性。
【学位授予单位】:东南大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:TP311.13

【参考文献】
中国期刊全文数据库 前10条
1 陆介平,刘月波,倪巍伟,刘同明,孙志挥;基于PrefixSpan的快速交互序列模式挖掘算法[J];东南大学学报(自然科学版);2005年05期
2 陆介平;刘月波;倪巍伟;陈耿;孙志挥;;基于投影数据库的序列模式挖掘增量式更新算法[J];东南大学学报(自然科学版);2006年03期
3 陈金玉,樊兴华,曹长修;序列模式的一种挖掘算法[J];重庆大学学报(自然科学版);2001年01期
4 杨明,孙志挥,吉根林;快速挖掘全局频繁项目集[J];计算机研究与发展;2003年04期
5 崔立新,苑森淼,赵春喜;约束性相联规则发现方法及算法[J];计算机学报;2000年02期
6 张勇,张德运,李胜磊;基于分布协作式代理的网络入侵检测技术的研究与实现[J];计算机学报;2001年07期
7 连一峰,戴英侠,王航;基于模式挖掘的用户行为异常检测[J];计算机学报;2002年03期
8 杨明,孙志挥;一种基于前缀广义表的关联规则增量式更新算法[J];计算机学报;2003年10期
9 周斌,吴泉源;序列模式挖掘的一种渐进算法[J];计算机学报;1999年08期
10 邹翔,张巍,蔡庆生,王清毅;大型数据库中的高效序列模式增量式更新算法[J];南京大学学报(自然科学版);2003年02期
【共引文献】
中国期刊全文数据库 前10条
1 赵群礼;;基于FP-Tree的最大频繁项目集综合更新算法[J];安徽教育学院学报;2006年03期
2 赵群礼;卢朴;;基于T-tree的最大频繁项目集挖掘算法[J];合肥师范学院学报;2009年06期
3 杨明,杨萍;一种基于前缀广义表的快速间接关联挖掘算法[J];安徽工程科技学院学报(自然科学版);2004年04期
4 梅俊;郑刚;;一种基于临时表的关联规则增量更新算法[J];安徽工程科技学院学报(自然科学版);2010年01期
5 吴应清;;异常数据挖掘在实际中的应用[J];办公自动化;2011年10期
6 蔡茂荣,陈波,陈强;分布式入侵检测体系结构研究[J];兵工自动化;2003年02期
7 马帅,唐世渭,杨冬青,王腾蛟,高军;移动环境中的最大移动序列模式挖掘(英文)[J];北京大学学报(自然科学版);2004年03期
8 黄鑫,尹宝林;多层次多策略的分布式网络信息过滤系统模型[J];北京航空航天大学学报;2003年10期
9 安颖;;基于Apriori算法的兴趣集加权关联规则挖掘[J];北京联合大学学报(自然科学版);2008年04期
10 邱舟强;滕少华;李振坤;陈平华;张巍;;数据挖掘技术在网络入侵检测中的应用[J];江西师范大学学报(自然科学版);2006年01期
中国重要会议论文全文数据库 前10条
1 陈显周;俞守华;区晶莹;;异常挖掘在猪只行为数据分析上的应用[A];2011年中国农业系统工程学术年会论文集;海峡两岸农业学术研讨会论文集;长沙市第五届自然科学学术年会农学研讨会论文集[C];2011年
2 姚伟力;王锡禄;宋俊德;;基于序列模式挖掘的告警相关性分析算法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
3 李培;李燕杰;刘晓燕;;基于移动Agent的分布式入侵检测系统[A];广西计算机学会2004年学术年会论文集[C];2004年
4 李培;李燕杰;刘晓燕;;基于移动Agent的分布式入侵检测系统[A];广西计算机学会——2004年学术年会论文集[C];2004年
5 李世林;安力;;入侵检测系统的设计与实现[A];第十八次全国计算机安全学术交流会论文集[C];2003年
6 李云霞;郑宏;李平;;基于遗传算法的自适应入侵检测系统研究[A];2005中国控制与决策学术年会论文集(下)[C];2005年
7 王波;张斌;;一种基于云模型的时间序列特征表示方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
8 王新生;李彦辉;张颖;;基于代理的分布式入侵检测系统模型的研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
9 高翔;王敏;;模糊频繁情节挖掘算法在入侵检测中的应用[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
10 李忠哗;何丕廉;;一种分布环境中最大频繁项目集挖掘算法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
中国博士学位论文全文数据库 前10条
1 李强;数据挖掘中关联分析算法研究[D];哈尔滨工程大学;2010年
2 何建民;面向网络社区聆听客户声音方法研究[D];合肥工业大学;2010年
3 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
4 李彤岩;基于数据挖掘的通信网告警相关性分析研究[D];电子科技大学;2010年
5 邵纪东;非线性过程监测中的数据降维及相关问题研究[D];浙江大学;2010年
6 苏晓珂;基于聚类的异常挖掘算法研究[D];东华大学;2010年
7 程文聪;面向大规模网络安全态势分析的时序数据挖掘关键技术研究[D];国防科学技术大学;2010年
8 马鑫;基于协同机制和智能算法的多代理系统研究及应用[D];吉林大学;2011年
9 张晓辉;云理论和数据挖掘在水上安全分析中的应用[D];大连海事大学;2011年
10 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 梅俊;数据挖掘中关联规则算法的研究及应用[D];安徽工程大学;2010年
2 景三东;Web对象可缓存性与一致性问题研究[D];郑州大学;2010年
3 王德才;数据挖掘在校园卡消费行为分析中的研究与应用[D];哈尔滨工程大学;2010年
4 史文财;省级政务网安全检测系统的设计与实现[D];哈尔滨工程大学;2010年
5 王秀锋;网络环境下异构日志信息获取和预处理研究[D];哈尔滨工程大学;2010年
6 李露璐;分布式入侵检测系统的报警关联与分析算法[D];大连理工大学;2009年
7 任芳;时间序列数据挖掘研究[D];辽宁师范大学;2010年
8 陈宇晖;基于数据挖掘的入侵检测方法研究[D];长沙理工大学;2010年
9 朱彦霞;多关系关联规则及其在HRM中的应用[D];河南工业大学;2010年
10 冯兴祥;关联规则挖掘在高校招生录取中的应用[D];合肥工业大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 杨明,孙志挥,吉根林;一种基于分布式数据库的全局频繁项目集更新算法[J];东南大学学报(自然科学版);2002年06期
2 杨明,孙志挥,吉根林;快速挖掘全局频繁项目集[J];计算机研究与发展;2003年04期
3 杨明,孙志挥;一种基于前缀广义表的关联规则增量式更新算法[J];计算机学报;2003年10期
4 周斌,吴泉源;序列模式挖掘的一种渐进算法[J];计算机学报;1999年08期
5 肖利,金远平,徐宏炳,王能斌;基于多维标度的快速挖掘关联规则算法[J];软件学报;1999年07期
6 路松峰,卢正鼎;快速开采最大频繁项目集[J];软件学报;2001年02期
7 宋余庆,朱玉全,孙志挥,陈耿;基于FP-Tree的最大频繁项目集挖掘及更新算法[J];软件学报;2003年09期
8 胡侃,夏绍玮;基于大型数据仓库的数据采掘:研究综述[J];软件学报;1998年01期
9 冯玉才,冯剑琳;关联规则的增量式更新算法[J];软件学报;1998年04期
10 欧阳为民,蔡庆生;发现广义序贯模式的增量式更新技术[J];软件学报;1998年10期
【相似文献】
中国期刊全文数据库 前10条
1 庄军;郭平;周杨;周劲;蔡日旭;;路由器日志序列模式挖掘[J];计算机科学;2005年11期
2 庄军;李峰;叶世清;刘侃;何皎;;HIS系统中药物医嘱序列模式挖掘[J];医疗卫生装备;2007年07期
3 施晓静;;浅谈在企业中如何正确使用数据挖掘技术[J];山西科技;2009年01期
4 于净;李定远;王海燕;;数据挖掘在医药信息学中的应用探究[J];中国中医药现代远程教育;2010年20期
5 宋慧勇;;数据挖掘技术在CRM中的应用[J];黑龙江科技信息;2007年24期
6 叶玉萍;;数据挖掘技术在物流业中的应用研究[J];福建电脑;2009年05期
7 马玲;孟庆新;;基于数据挖掘的入侵检测系统研究[J];电脑学习;2009年04期
8 宋举;;数据挖掘技术在电子商务领域中的应用[J];现代商业;2010年15期
9 吕爱丽;魏海平;叶小涛;;基于数据挖掘的Multi-Agent动态取证系统研究[J];辽宁石油化工大学学报;2008年01期
10 叶小涛;玄绪强;吕爱丽;;数据挖掘在动态取证系统中的应用研究[J];计算机安全;2008年10期
中国重要会议论文全文数据库 前10条
1 刘楚玲;谢赞福;;时间序列数据挖掘在信息系统维护中的应用[A];2008年计算机应用技术交流会论文集[C];2008年
2 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
3 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
4 阮鸣梁;陈维默;;数据挖掘技术的发展与应用[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
5 石磊;王伟华;武张亮;杨晓泉;;Web挖掘技术在电子商务中的应用[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
6 王伟;殷国富;;基于数据挖掘的多维联机分析处理系统研究[A];全国先进制造技术高层论坛暨制造业自动化、信息化技术研讨会论文集[C];2005年
7 叶伟芳;徐迪;;数据挖掘及其在金融领域的应用[A];中国企业运筹学学术交流大会论文集[C];2005年
8 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
9 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
10 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
中国重要报纸全文数据库 前10条
1 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
2 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
3 山东省临清市国税局;关联分析现疑点 实地取证露端倪[N];中国税务报;2010年
4 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
5 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
6 首之;数据挖掘并不神秘[N];金融时报;2006年
7 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
8 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
9 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
10 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
中国博士学位论文全文数据库 前10条
1 陆介平;描述性规则挖掘若干关键技术研究[D];东南大学;2006年
2 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
3 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
4 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
5 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
6 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
7 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
8 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
9 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
10 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 孟宪苹;基于序列模式挖掘的入侵检测系统的研究与实现[D];南京航空航天大学;2008年
2 郭跃斌;基于序列模式的正负关联规则挖掘技术[D];山东轻工业学院;2008年
3 刘磊;基于序列模式挖掘的入侵检测算法的研究[D];中国科学技术大学;2009年
4 张圆圆;序列模式发现模型的研究[D];合肥工业大学;2007年
5 李春媚;基于序列模式挖掘的入侵检测研究及应用[D];长沙理工大学;2007年
6 贾宁;基于数据挖掘的软件测试技术研究[D];天津大学;2007年
7 陈景强;序列模式挖掘在Web日志挖掘中应用研究[D];重庆大学;2008年
8 但红卫;基于偏序的频繁序列模式压缩算法研究[D];浙江大学;2007年
9 张甲武;序列模式挖掘在软件开发信息库中的应用[D];大连理工大学;2009年
10 王峰;基于数据挖掘的入侵检测系统的设计与实现[D];山东大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026