收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

描述性规则挖掘若干关键技术研究

陆介平  
【摘要】: 描述性规则挖掘是数据挖掘研究领域的重要课题之一。数据挖掘的任务是从大量的数据中发现模式,按照其功能作用可分为预测性和描述性挖掘,描述性规则挖掘对数据中存在的规律、规则做出一种描述,它涵盖了数据挖掘中关联分析、序列模式发现等重要研究领域。 论文研究工作结合省知识产权平台建设工作,针对专利文献的挖掘和利用,在现有的描述性规则挖掘研究的基础上,针对描述性规则挖掘的实际需求和若干需要解决的关键技术,以关联规则分析为基础,对描述性规则挖掘中的序列模式挖掘技术、分布环境下关联规则快速挖掘技术以及基于关联分析的离群知识发现方法等进行研究。 针对序列模式挖掘过程本身是一个反复的交互式过程,提出了一种基于PrefixSpan的快速交互式序列模式挖掘算法,当最小支持度发生变化时,算法能够充分利用前次或中间结果,快速生成新的模式;结合序列模式的增量式更新问题,提出了基于投影数据库的序列模式增量式更新算法ISPMP,算法采用间接拼接的方法更新已经得到的序列,用增量数据库来减小投影数据库,从而有效提高算法效率;在此基础上,为了进一步提高序列模式挖掘的效率,提出了一种基于二进制形式的候选频繁序列模式生成和相应的计算支持数方法,该方法只需对挖掘对象进行一些“或”、“与”、“异或”、等逻辑运算操作,显著降低了候选频繁序列模式生成和相应的支持数计算的实现难度,将该方法与序列模式挖掘及更新算法相结合,可以有效提高序列模式挖掘及更新算法的效率;针对大数据集关联规则发现问题,提出了一种快速挖掘全局最大频繁项目集算法FMGMFI,该算法采用FP-tree存储结构,由于FP-tree结构是一种压缩的存储结构,数据库中的记录可被压缩存储在建立的局部FP-tree的各路经中,使得FMGMFI可方便地从各局部FP-tree的相关路径中得到项目集的支持度,同时采用自顶向下和自底向上的双向搜索策略,可有效地降低网络通讯代价,高效地生成关联规则;最后,针对现有离群点检测算法多数面向低维空间数据,并且缺少语义解释的问题,结合关联分析及粗糙集知识提出了一种基于关联分析的离群点检测算法,算法可以有效发现存在于大量数据集中有别于正常关联模式的那些异常数据点。 在论文的研究过程中,针对所提出各种算法进行了大量的实验验证,实验结果表明了算法的合理性和有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 庄军;郭平;周杨;周劲;蔡日旭;;路由器日志序列模式挖掘[J];计算机科学;2005年11期
2 庄军;李峰;叶世清;刘侃;何皎;;HIS系统中药物医嘱序列模式挖掘[J];医疗卫生装备;2007年07期
3 施晓静;;浅谈在企业中如何正确使用数据挖掘技术[J];山西科技;2009年01期
4 于净;李定远;王海燕;;数据挖掘在医药信息学中的应用探究[J];中国中医药现代远程教育;2010年20期
5 宋慧勇;;数据挖掘技术在CRM中的应用[J];黑龙江科技信息;2007年24期
6 叶玉萍;;数据挖掘技术在物流业中的应用研究[J];福建电脑;2009年05期
7 马玲;孟庆新;;基于数据挖掘的入侵检测系统研究[J];电脑学习;2009年04期
8 宋举;;数据挖掘技术在电子商务领域中的应用[J];现代商业;2010年15期
9 吕爱丽;魏海平;叶小涛;;基于数据挖掘的Multi-Agent动态取证系统研究[J];辽宁石油化工大学学报;2008年01期
10 叶小涛;玄绪强;吕爱丽;;数据挖掘在动态取证系统中的应用研究[J];计算机安全;2008年10期
11 岳耀雪;;基于数据挖掘算法的网络入侵检测系统研究[J];计算机安全;2009年10期
12 郑飞;;基于数据挖掘的燃气管道风险评估模型的优化[J];交通与计算机;2008年06期
13 刘锡铃;;电子商务中数据挖掘技术的选择[J];黑龙江科技信息;2007年20期
14 陈振海;孙世温;;数据挖掘在军交后付运费数据分析中的应用[J];四川兵工学报;2008年02期
15 艾晶;宋自林;赵靓;赵文飞;;聚类思想在挖掘关联规则中的运用[J];广西师范大学学报(自然科学版);2009年01期
16 成淼;;数据挖掘在电子商务中的应用[J];科技经济市场;2010年09期
17 张丽敏;;电子商务中数据挖掘技术的使用[J];内蒙古电大学刊;2007年02期
18 孙俊玲;;在电子商务中如何更好的使用数据挖掘技术[J];河南科技学院学报(自然科学版);2008年04期
19 郭红涛;郭永红;郭朝彬;;数据挖掘技术在物流信息系统中的应用[J];科技信息;2009年04期
20 崔胜;;数据处理技术在电子商务中的应用研究[J];光盘技术;2009年03期
中国重要会议论文全文数据库 前10条
1 刘楚玲;谢赞福;;时间序列数据挖掘在信息系统维护中的应用[A];2008年计算机应用技术交流会论文集[C];2008年
2 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
3 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
4 阮鸣梁;陈维默;;数据挖掘技术的发展与应用[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
5 石磊;王伟华;武张亮;杨晓泉;;Web挖掘技术在电子商务中的应用[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
6 王伟;殷国富;;基于数据挖掘的多维联机分析处理系统研究[A];全国先进制造技术高层论坛暨制造业自动化、信息化技术研讨会论文集[C];2005年
7 叶伟芳;徐迪;;数据挖掘及其在金融领域的应用[A];中国企业运筹学学术交流大会论文集[C];2005年
8 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
9 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
10 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
中国博士学位论文全文数据库 前10条
1 陆介平;描述性规则挖掘若干关键技术研究[D];东南大学;2006年
2 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
3 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
4 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
5 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
6 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
7 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
8 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
9 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
10 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 孟宪苹;基于序列模式挖掘的入侵检测系统的研究与实现[D];南京航空航天大学;2008年
2 郭跃斌;基于序列模式的正负关联规则挖掘技术[D];山东轻工业学院;2008年
3 刘磊;基于序列模式挖掘的入侵检测算法的研究[D];中国科学技术大学;2009年
4 张圆圆;序列模式发现模型的研究[D];合肥工业大学;2007年
5 李春媚;基于序列模式挖掘的入侵检测研究及应用[D];长沙理工大学;2007年
6 贾宁;基于数据挖掘的软件测试技术研究[D];天津大学;2007年
7 陈景强;序列模式挖掘在Web日志挖掘中应用研究[D];重庆大学;2008年
8 但红卫;基于偏序的频繁序列模式压缩算法研究[D];浙江大学;2007年
9 张甲武;序列模式挖掘在软件开发信息库中的应用[D];大连理工大学;2009年
10 王峰;基于数据挖掘的入侵检测系统的设计与实现[D];山东大学;2006年
中国重要报纸全文数据库 前10条
1 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
2 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
3 山东省临清市国税局;关联分析现疑点 实地取证露端倪[N];中国税务报;2010年
4 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
5 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
6 首之;数据挖掘并不神秘[N];金融时报;2006年
7 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
8 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
9 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
10 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978