收藏本站
《山东师范大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于决策树的分类算法研究和应用

迟庆云  
【摘要】:面对信息时代海量数据的出现,如何有效利用海量的原始数据分析现状和预测未来,已经成为人类面临的一大挑战。由此,数据挖掘技术应运而生并得到迅猛发展。 数据挖掘是指从数据库中抽取隐含的、具有潜在使用价值信息的过程,是一种新型的数据分析技术,被广泛应用于银行金融、保险、政府、教育、运输等企事业单位及国防科研上。数据挖掘应用的普遍性及带来的巨大经济和社会效益,吸引了许多专家和研究机构从事该领域的研究。 数据分类是数据挖掘中一个重要的内容。分类存在很多方法,其中决策树归纳以其易于提取显式规则、计算量相对较小、可以显示重要的决策属性和较高的分类准确率等优点而得到广泛的应用。据统计,目前决策树算法是利用最广泛的数据挖掘算法之一,利用率高达19%。应用领域已由医疗到博弈论和商务等领域,是一些商业规则归纳系统的基础。 寻找新的构造决策树和简化决策树的方法一直是决策树技术研究的一个热点。SLIQ算法和SPRINT算法很好的解决了磁盘驻留数据太大以至于无法被内存容纳带来的问题。它没有采纳利用抽样或划分数据集来获得可容纳于内存的小树据的处理方法,而是采用了一种新的数据结构,直接在整个数据集上建立一棵决策树。但SPRINT、SLIQ等算法处理的训练集的大小都是固定的,来自稳定的环境,人为干预较少,忽视了数据的变化趋势。在现实生活中,数据集并不是稳定的,而是连续到来的。将现有的算法改进使其能够适应不断生长的训练集,生成一棵与旧树相关的树是十分有现实意义的。 本文的研究工作源于上述的背景,目的是对数据库知识发现进行深入的研究,探索数据挖掘中决策树的更新问题,以更好的应用于实际工作中,主要进行了以下的研究工作: 1、指出构造好的决策树的关键在于如何选择好的逻辑判断或属性,比较了信息增益、基尼指数属性选择度量方法的优缺点,探讨了将离散属性值组合计算基尼指数来构造二叉树的方法。 2、研究了决策树的几种生成算法和剪枝算法,比较了它们的优缺点,特别是针对可伸缩的SPRINT算法做了全面的分析。深入探讨了建树算法与剪枝算法的集成问题,即Public算法以及一个可应用于其它算法
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP301.6

知网文化
【引证文献】
中国期刊全文数据库 前1条
1 冯俊青;郁志宏;;PSO-BP网络模型在数据分类中的应用[J];自动化技术与应用;2007年11期
中国硕士学位论文全文数据库 前4条
1 沈家瑞;通信对抗中的干扰识别技术研究[D];电子科技大学;2011年
2 潘天鸣;基于Hadoop平台的决策树算法并行化研究[D];华东师范大学;2012年
3 白秀莲;基于决策树方法的遥感影像分类研究[D];内蒙古师范大学;2012年
4 董连英;Hyperion影像森林植被分类方法与应用研究[D];吉林大学;2013年
【参考文献】
中国期刊全文数据库 前10条
1 王大玲,于戈,鲍玉斌,王国仁;一种基于关联性度量的决策树分类方法[J];东北大学学报;2001年05期
2 张祥德,张巍,刘玉蓉;数据挖掘分类问题的贪婪粗糙集约简算法[J];东北大学学报;2001年05期
3 张宜生,刘凡,梁书云;人力资源数据挖掘技术及其应用[J];计算机工程与应用;2002年06期
4 李波;基于SLIQ分类算法的数据挖掘技术及其在企业CRM中的应用[J];计算机工程与应用;2002年21期
5 尹阿东,谢霖铨,龙誉,杨立东;动态决策树算法研究[J];计算机工程与应用;2004年33期
6 朱绍文,胡宏银,王泉德,张大斌,黄浩,陆玉昌;决策树采掘技术及发展趋势[J];计算机工程;2000年10期
7 张维东,张凯,董青,孙维华;利用决策树进行数据挖掘中的信息熵计算[J];计算机工程;2001年03期
8 刘昆,刘业政;基于决策树的医疗数据分析[J];计算机工程;2002年02期
9 郭景峰,米浦波,刘国华;决策树算法的并行性研究[J];计算机工程;2002年08期
10 唐华松,姚耀文;数据挖掘中决策树算法的探讨[J];计算机应用研究;2001年08期
【共引文献】
中国期刊全文数据库 前10条
1 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
2 吕俊;任雪萍;;一种基于粗糙集理论的变压器故障多变量决策树诊断方法[J];安徽电气工程职业技术学院学报;2011年01期
3 干娟;;基于决策树算法的学生综合测评系统的设计[J];安徽电子信息职业技术学院学报;2011年04期
4 李玲玲;辛浩;;FCM算法及其有效性度量方法[J];安徽电子信息职业技术学院学报;2011年05期
5 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
6 袁华;章皖秋;郭洪江;;面向对象方法在Quick Bird影像分类中的应用研究[J];安徽农业科学;2011年10期
7 陈玉峰;张红燕;敬松;谢元瑰;;基于数据挖掘的农民工就业推荐系统构建[J];安徽农业科学;2011年33期
8 郭有强;胡学钢;;基于项目增长法高效求解最大频繁项集[J];安徽科技学院学报;2006年06期
9 朱献文;李景富;;基于混合神经网络的异常信息流检测模型[J];信息安全与技术;2011年10期
10 张友志;钱萌;程玉胜;;基于关联规则web日志挖掘方法的研究[J];安庆师范学院学报(自然科学版);2006年01期
中国重要会议论文全文数据库 前10条
1 周炎涛;唐剑波;王家琴;;基于信息熵的改进TFIDF特征选择算法[A];第二十六届中国控制会议论文集[C];2007年
2 赵云鹏;石丽;刘莹;;基于数据挖掘的高校规模分析及应用研究[A];第九届全国信息获取与处理学术会议论文集Ⅰ[C];2011年
3 王皓;曹永锋;孙洪;;基于流域变换的聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
4 吴栋;张京华;王玉成;胡伍生;;前兆信息模型在地震预测中的应用[A];数字测绘与GIS技术应用研讨交流会论文集[C];2008年
5 孟少朋;骆红云;李盛;;基于数据挖掘的汽车可靠性分析方法研究[A];2007年全国失效分析学术会议论文集[C];2007年
6 杨静;申艳光;邢丽莉;;数据仓库与数据挖掘的研究与应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
7 滕明鑫;高占国;杨秀清;;数据挖掘中决策树算法优化研究[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
8 杨纪军;朱培栋;;关联规则挖掘技术在蜜罐系统中的应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
9 朱攀;陈跃新;;Apriori算法在参保人信用度评价中的应用[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
10 阮鸣梁;陈维默;;数据挖掘技术的发展与应用[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
2 黄利兴;基于文本挖掘技术探索姚荷生咳嗽医案的证治规律[D];湖南中医药大学;2010年
3 王冬丽;基于可扩展的支持向量机分类算法及在信用评级中的应用[D];东华大学;2011年
4 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
5 李燕;“调肺”治疗儿童多发性抽动症医案数据挖掘研究及中药复方对小鼠免疫功能影响的研究[D];北京中医药大学;2011年
6 金海浩;五行相生间接补法古代应用规律研究[D];南京中医药大学;2011年
7 陈聆;地球化学矿致异常非线性分析方法研究[D];成都理工大学;2011年
8 孟京辉;经营单位级森林经营数据仓库研建及应用研究[D];中国林业科学研究院;2011年
9 任炳昱;高拱坝施工实时控制理论与关键技术研究[D];天津大学;2010年
10 何月顺;关联规则挖掘技术的研究及应用[D];南京航空航天大学;2010年
中国硕士学位论文全文数据库 前10条
1 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
2 李翠;基于车辆自动识别的智能计重监控系统的研究与设计[D];郑州大学;2010年
3 刘春燕;教学网络DIDS数据分析方法的研究与改进[D];郑州大学;2010年
4 史文财;省级政务网安全检测系统的设计与实现[D];哈尔滨工程大学;2010年
5 尹丽玲;基于人工免疫算法的Web文本挖掘研究[D];哈尔滨工程大学;2010年
6 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
7 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
8 姜雪飞;基于SNMP的网络安全态势可视化技术[D];哈尔滨工程大学;2010年
9 周东海;基于记账凭证的高校教育成本数据挖掘研究[D];哈尔滨工程大学;2010年
10 李红;数据挖掘中特征选择与聚类算法研究[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 谭衢霖;刘正军;沈伟;;一种面向对象的遥感影像多尺度分割方法[J];北京交通大学学报;2007年04期
2 杨小明;陶然;;直接序列扩频通信系统中干扰样式的自动识别[J];兵工学报;2008年09期
3 杨诸胜;郭雷;罗欣;胡新韬;;基于分段主成分分析的高光谱图像波段选择算法研究[J];测绘工程;2006年03期
4 潘琛;杜培军;张海荣;;决策树分类法及其在遥感图像处理中的应用[J];测绘科学;2008年01期
5 尹作霞;杜培军;陈云浩;谭琨;;面向对象的高光谱影像目标识别方法[J];测绘科学;2009年02期
6 张彤,潘和平;决策树的形式算法及其在地理信息学中的应用[J];测绘通报;2002年07期
7 李迅;陆农春;卫强;周建军;梁艳华;;基于BP神经网络的通信信号调制体制识别技术[J];电讯技术;2006年01期
8 郭伟;跳频通信的干扰方式研究[J];电子科技大学学报;1996年S3期
9 李杨;江南;吕恒;张瑜;苗翠翠;王妮;;基于水稻特征波段的决策树分类研究[J];地理与地理信息科学;2010年02期
10 周雨霁;田庆久;;EO-1 Hyperion高光谱数据的质量评价[J];地球信息科学;2008年05期
中国博士学位论文全文数据库 前4条
1 延昊;中国土地覆盖变化与环境影响遥感研究[D];中国科学院研究生院(遥感应用研究所);2002年
2 骆成凤;中国土地覆盖分类与变化监测遥感研究[D];中国科学院研究生院(遥感应用研究所);2005年
3 李春干;面向对象的SPOT5图像森林分类研究[D];北京林业大学;2009年
4 王书舟;支持向量机方法及其应用研究[D];哈尔滨工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 郑雅琼;基于数据挖掘的故障诊断方法研究[D];太原理工大学;2011年
2 王志辉;高光谱遥感在森林树种识别中的应用[D];浙江农林大学;2011年
3 祝鹏飞;面向对象的高光谱影像地物分类技术研究[D];解放军信息工程大学;2011年
4 戴南;基于决策树的分类方法研究[D];南京师范大学;2003年
5 薛峙;基于PVM的SLIQ算法的并行化研究[D];重庆大学;2003年
6 宾晟;数据挖掘在人口普查数据中的应用[D];青岛大学;2004年
7 张旭;数字滤波技术在医学图像去噪处理中的应用研究[D];中北大学;2005年
8 张倩;基于决策树方法的航空高光谱遥感土地覆盖分类研究[D];山东科技大学;2005年
9 许宁;对粒子群算法的改进及应用[D];浙江大学;2006年
10 陈鑫;基于决策树技术的遥感影像分类研究[D];南京林业大学;2006年
【二级引证文献】
中国期刊全文数据库 前2条
1 王彤彤;张剑;涂川;赵文芳;陈明明;赵成章;;IPSO-BP神经网络在渭河天水段水质评价中的应用[J];环境科学与技术;2013年08期
2 贾伟;范婕;;PSO-BP模型在高校学生个人信用评价中的应用[J];计算机系统应用;2011年02期
中国硕士学位论文全文数据库 前4条
1 范婕;基于PSO-BP模型的高校学生个人信用评价体系研究[D];山西财经大学;2010年
2 马俊;PSO神经网络及其在冷连轧机张力控制中的应用研究[D];东北大学;2008年
3 高连花;基于社会化标签的个性化信息服务研究[D];华中师范大学;2012年
4 刘健;新材料产业上市公司投资价值分析[D];河北工业大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 尹阿东,宫雨,吴胜利,武森,高学东,李拥军;增量决策树算法及复杂度分析[J];北京科技大学学报;2004年02期
2 郝先臣,张德干,高光来,赵海;数据挖掘工具和应用中的问题[J];东北大学学报;2001年02期
3 毕建东,杨挂芳;基于熵的决策树分枝合并算法[J];哈尔滨工业大学学报;1997年02期
4 肖勇,陈意云;用遗传算法构造决策树[J];计算机研究与发展;1998年01期
5 陈元,陈文伟;数据开采与统计学[J];计算机工程与应用;2000年05期
6 王大玲;于戈;鲍玉斌;王国仁;刘斌武;;基于概念层次树的数据挖掘算法的研究与实现[J];计算机科学;2001年06期
7 朱绍文,胡宏银,王泉德,张大斌,黄浩,陆玉昌;决策树采掘技术及发展趋势[J];计算机工程;2000年10期
8 郭景峰,米浦波,刘国华;决策树算法的并行性研究[J];计算机工程;2002年08期
9 洪家荣,丁明峰,李星原,王丽薇;一种新的决策树归纳学习算法[J];计算机学报;1995年06期
10 张朝晖,陆玉昌,张钹;利用神经网络发现分类规则[J];计算机学报;1999年01期
【相似文献】
中国期刊全文数据库 前2条
1 戴君琴;面向CRM的数据挖掘技术的应用[J];情报杂志;2004年07期
2 崔杰,张颍;数据挖掘技术在CRM中的运用[J];辽宁工学院学报(自然科学版);2002年06期
中国博士学位论文全文数据库 前2条
1 巩垠熙;多元林业信息融合的立地知识发现研究[D];北京林业大学;2013年
2 张谷丰;基于WebGis的农作物病虫预警诊断平台[D];南京农业大学;2009年
中国硕士学位论文全文数据库 前10条
1 王晓平;基于粗糙集的决策树优化算法研究[D];四川师范大学;2013年
2 尹洪泽;基于核心示例集的属性约简方法研究[D];河北科技大学;2012年
3 王强;决策树过拟合问题研究[D];合肥工业大学;2008年
4 张国荣;基于粗糙集的数据挖掘算法研究与应用[D];西北师范大学;2011年
5 王楚;基于改进决策树的入侵检测算法的研究[D];东北大学;2011年
6 郑利锋;数据挖掘在海南旅游服务管理中的应用与实现[D];电子科技大学;2012年
7 张峰;基于数据挖掘技术的教学管理应用研究[D];合肥工业大学;2010年
8 谢凯;基于聚类的数据预处理对模糊决策树归纳的影响[D];河北大学;2006年
9 余昌瑾;图像挖掘技术研究与应用[D];武汉理工大学;2010年
10 李兰晓;面向手语视频拼接的过渡视频库构建方法研究[D];北京工业大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026