收藏本站
《中国人民解放军信息工程大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘技术与分类算法研究

刘刚  
【摘要】:数据挖掘(Data Mining)是致力于数据分析和理解,揭示数据内部蕴藏知识的技术。它是未来信息技术应用的重要目标之一。经过数据挖掘领域研究工作者十几年的努力,出现了许多数据挖掘的新概念、新方法,特别是最近几年,一些基本概念和方法趋于清晰,数据挖掘的研究正向着更加深入的方向发展。像其它新技术的发展历程一样,数据挖掘技术也要经过概念提出、概念接受、广泛研究和探索、逐步应用和大量应用等阶段。从目前的现状看,大部分学者认为数据挖掘的研究仍然处于广泛研究和探索阶段,迫切需要在基础理论、应用模式、系统构架以及挖掘算法和挖掘语言等方面进行创新。 分类作为数据挖掘的一个重要研究课题,在统计学、机器学习、神经网络和专家系统中得到了较早的研究,但其中大部分都是内存驻留算法,通常假定数据量很小。随着数据库中数据量和维数越来越大,建立高效的、适用于大量数据集的分类算法已成为数据挖掘面临的一个挑战性问题。近年来,数据挖掘界提出一种新的知识模式,称作跳跃显露模式(JEP:Jumping Emerging Pattern),用来表示两个数据集之间的重大差异,并出现了一些基于JEP的分类算法。研究表明,这些基于JEP的分类算法具有很好的预测准确性,而且数据量和维数都是可规模化的。但是,这些基于JEP的分类法通常需要挖掘大量的JEP,因此影响了它们的效率,且增加了分类算法的复杂性。本文提出一种特殊类型的JEP,称作最有效的跳跃显露模式(SJEP:most Significant Jumping Emerging Patterns)。分析结果表明,SJEP具有很强的区分能力,足以用来建立精确的分类算法。由于已有的算法都不能直接挖掘这种SJEP,本文给出了一种可以在两个数据集上双向挖掘SJEP的有效算法,并讨论了如何建立基于SJEP的分类算法(SJEP_Classifier)。与已有的基于JEP的分类算法相比,基于SJEP的分类算法不仅使用的JEP数量少,预测精度高,而且可以在很短的时间内(通常为若干秒)完成学习阶段。实验结果表明,本文的分类算法(SJEP_Classifier)在平均预测精度方面也优于CBA和C4.5等分类算法。 总之,本文在分析、归类现有数据挖掘研究成果以及原型系统的基础上,进行了数据挖掘应用系统体系结构和基于SJEP的分类理论模型以及算法方面的研究,所设计的算法在挖掘效率和对大型数据库挖掘的可用性方面具有潜在的应用前景。
【学位授予单位】:中国人民解放军信息工程大学
【学位级别】:博士
【学位授予年份】:2004
【分类号】:TP311.13

【引证文献】
中国期刊全文数据库 前1条
1 高家明;薛京生;肖涛;;基于支撑向量机回归的接警量预测与比较[J];软件;2013年07期
中国博士学位论文全文数据库 前4条
1 李宏;面向应用领域的分类方法研究[D];中南大学;2007年
2 方辉;机械制造信息资源的非规范知识处理技术研究[D];四川大学;2007年
3 卢梅;建筑工程项目实施状态健康诊断指标体系研究[D];西安建筑科技大学;2008年
4 王凯;基于粗集理论的工程项目管理指标及其体系研究[D];北京交通大学;2012年
【参考文献】
中国期刊全文数据库 前1条
1 施伯乐,汪卫;数据仓库与数据挖掘研究进展[J];计算机应用与软件;2003年11期
【共引文献】
中国期刊全文数据库 前10条
1 潘希姣;;多子群粒子群集成神经网络[J];安徽建筑工业学院学报(自然科学版);2007年02期
2 杨云;彭佳红;方逵;;基于决策树技术的农产品供应商质量控制及其实现[J];安徽农业科学;2010年29期
3 郇正军;赵国富;;基于土地利用的空间数据挖掘系统的设计与实现[J];安徽农业科学;2011年07期
4 叶彩虹;Web挖掘在网上购物中的应用研究[J];安庆师范学院学报(自然科学版);2004年04期
5 王敏,王福田,刘仍奎;基于客户服务中心的铁路客运营销系统[J];北京交通大学学报;2004年06期
6 陈景年;黄厚宽;杨莉萍;田凤占;;基于分布不完整数据选择性分类器[J];北京交通大学学报;2008年02期
7 陈景年;黄厚宽;徐力;伊传环;;利用增益率构建混合型选择性不完整数据分类器[J];北京交通大学学报;2009年05期
8 林正奎;唐焕玲;鲁明羽;王敬东;;基于特征多视图提升Naive Bayesian的Boosting改进算法[J];北京交通大学学报;2009年06期
9 王中锋;王志海;付彬;;贝叶斯网络分类器结构与变量分布的差异性分析[J];北京交通大学学报;2011年02期
10 张海;王尧;陈冰;胡荣祖;高红旭;赵凤起;;用Boosting算法预测多硝基芳香族化合物的密度[J];火炸药学报;2007年05期
中国重要会议论文全文数据库 前10条
1 程泽凯;泰锋;;贝叶斯网络分类器结构学习:基于启发式的G2算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 杨波;秦锋;程泽凯;;一种新的分类学习系统评估度量[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 赵越岭;王英丽;;基于粗糙集感应电动机故障诊断决策规则分析[A];第二十七届中国控制会议论文集[C];2008年
4 ;Gas Thickness On-line Monitoring Instrument Design Based on BP Neural Network[A];第二十七届中国控制会议论文集[C];2008年
5 ;Incremental Clustering for Categorical Data Using Clustering Ensemble[A];第二十九届中国控制会议论文集[C];2010年
6 ;Predictive Control Based on Multi-network for a Deep Seabed Mining Robot Vehicle[A];中国自动化学会控制理论专业委员会A卷[C];2011年
7 ;Fault Diagnosis Based on Bayesian Networks for the Data Incomplete Industrial System[A];中国自动化学会控制理论专业委员会A卷[C];2011年
8 张铮;胡社教;江萍;;基于EP模式的特征选择算法[A];2011中国仪器仪表与测控技术大会论文集[C];2011年
9 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
10 杨晓霞;朱庆;李海峰;;知识导航的遥感信息处理服务分类选择方法[A];中国测绘学会第九次全国会员代表大会暨学会成立50周年纪念大会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 李建平;面向异构数据源的网络安全态势感知模型与方法研究[D];哈尔滨工程大学;2010年
3 刘家国;基于突发事件风险的供应链利益分配与行为决策研究[D];哈尔滨工程大学;2010年
4 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
5 孟宇龙;基于本体的多源异构安全数据聚合[D];哈尔滨工程大学;2010年
6 邬俊;基于交互式语义推理的图像检索算法研究[D];大连海事大学;2010年
7 李炳龙;文档碎片取证关键技术研究[D];解放军信息工程大学;2007年
8 甘良志;核学习算法与集成方法研究[D];浙江大学;2010年
9 杨国鹏;基于机器学习方法的高光谱影像分类研究[D];解放军信息工程大学;2010年
10 李晋江;海量数据点三维重构中一类关键问题研究[D];山东大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 陈弋兰;王鸣;孙书诚;;朴素贝叶斯分类器的误差估计[J];安徽工程科技学院学报(自然科学版);2008年04期
2 罗雄飞;周勇;聂艳;于雷;;武汉市城市土地集约利用评价研究[J];安徽农业科学;2007年31期
3 李凯,黄厚宽;支持向量机增量学习算法研究[J];北方交通大学学报;2003年05期
4 徐薇,黄厚宽,秦勇;基于时空数据挖掘的铁路客流预测方法[J];北方交通大学学报;2004年05期
5 张于心,智明光;综合评价指标体系和评价方法[J];北方交通大学学报;1995年03期
6 左伟;李礴;;XML在文本加工中的应用和实现[J];中国传媒大学学报(自然科学版);2006年04期
7 初红艳;曹全军;费仁元;;基于加工单元的制造车间的生产调度研究[J];北京工业大学学报;2006年08期
8 孔昊;周长胜;;Web日志挖掘预处理研究[J];北京机械工业学院学报;2005年04期
9 万志强,杨超,郦正能;混合遗传算法在气动弹性多学科优化中的应用[J];北京航空航天大学学报;2004年12期
10 朱礼军;陈虔;刘慧;黄晓云;;基于知识本体的资源管理平台框架设计与实现[J];北京航空航天大学学报;2005年11期
中国重要会议论文全文数据库 前1条
1 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
中国博士学位论文全文数据库 前10条
1 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年
2 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
3 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
4 周海燕;空间数据挖掘的研究[D];中国人民解放军信息工程大学;2003年
5 郭秀娟;基于关联规则数据挖掘算法的研究[D];吉林大学;2004年
6 佘春东;数据挖掘算法分析及其并行模式研究[D];电子科技大学;2004年
7 王明怡;微阵列数据挖掘技术的研究[D];浙江大学;2004年
8 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
9 张宏斌;信息获取中的两类不确定问题研究[D];华中科技大学;2004年
10 李瑞轩;异构信息集成中的查询处理与优化研究[D];华中科技大学;2004年
【二级引证文献】
中国期刊全文数据库 前7条
1 刘耀南;;浅析数据挖掘及其应用[J];电脑知识与技术;2010年33期
2 龚文;;建筑工程施工管理要点探讨[J];法制与经济(上旬刊);2011年09期
3 刘红梅;;数据挖掘中分类方法探究[J];硅谷;2009年03期
4 方辉;谭建荣;谭颖;冯毅雄;;基于Web的制造信息主动推荐服务研究[J];计算机集成制造系统;2008年11期
5 李慧敏;;浅析建筑工程项目管理中的成本控制[J];门窗;2013年02期
6 孟庆轩;;基于J2EE的科技资源调查系统的设计与实现[J];计算机时代;2013年06期
7 管清贵;殷国富;胡晓兵;尹湘云;;基于模式语言的设计知识描述与发现方法研究[J];四川大学学报(工程科学版);2008年06期
中国博士学位论文全文数据库 前1条
1 曹济;IT行业经济与管理指标测度与预报模型实证研究[D];首都经济贸易大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 刘秀峰 ,詹秀菊;面向电子商务的数据挖掘技术[J];现代通信;2003年06期
2 孙京兰;;OLAP技术及数据挖掘 技术[J];中文信息;2003年04期
3 冯进;利用数据挖掘技术 深入挖掘图书馆工作[J];现代情报;2005年03期
4 王小燕;数据挖掘技术在超市中的应用研究[J];商场现代化;2005年05期
5 方忠祥,屠立;数据挖掘技术在客户关系管理中的应用研究[J];机床与液压;2005年06期
6 龙腾芳;数据挖掘技术在农业领域中的应用研究[J];微计算机信息;2005年08期
7 周勇;数据挖掘技术发展综述[J];中国科技信息;2005年16期
8 徐守军,高波,甄蓓,彭奕,王东根,王玉民,吴乐山;数据挖掘技术在科研管理中应用前景初探[J];中华医学科研管理杂志;2005年04期
9 张特来,刘万军;数据挖掘在医学领域的应用研究[J];自动化技术与应用;2005年10期
10 杨小云;;数据挖掘在图书馆中的应用[J];渭南师范学院学报;2005年S2期
中国重要会议论文全文数据库 前10条
1 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
2 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
3 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
4 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
5 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
6 王洪锋;;数据挖掘在客户关系管理中的应用研究[A];河南省通信学会2005年学术年会论文集[C];2005年
7 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
8 张婧;;数据挖掘技术在进销存系统中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
9 杨利军;勾学荣;;数据挖掘在移动客户流失预测中的研究和应用[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
10 孙义明;曾继东;;数据挖掘技术及其应用[A];全国计算机安全学术交流会论文集(第二十二卷)[C];2007年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
3 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
6 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
7 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
8 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
9 诺达咨询高级咨询顾问 周连升;数据挖掘拓展3G增值空间[N];通信产业报;2007年
10 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
2 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
3 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
4 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
5 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
6 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
7 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
8 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
9 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 赵林明;基于数据仓库的信用卡数据挖掘研究[D];山东科技大学;2005年
2 陈骏武;基于数据挖掘技术的电信客户关系管理研究[D];湖南大学;2005年
3 房静;面向CRM的数据挖掘在电力市场营销中的应用[D];天津大学;2004年
4 罗国甫;数据挖掘在银行客户经理考核系统中的应用[D];同济大学;2006年
5 王鑫;数据挖掘中聚类分析算法的研究[D];山东师范大学;2006年
6 袁明;基于网格的数据挖掘应用研究[D];西安电子科技大学;2007年
7 左红武;基于数据挖掘的房地产企业客户关系管理研究[D];昆明理工大学;2006年
8 田静;数据挖掘技术在防范住房信贷风险中的应用[D];贵州大学;2007年
9 柳迎春;电子商务环境下的顾客价值链挖掘[D];吉林大学;2007年
10 朱丽萍;一个支持商务智能的数据仓库系统的设计和实现[D];上海交通大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026