收藏本站
《华中师范大学》 2002年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘中决策树分类算法的研究

胡小刚  
【摘要】: 数据挖掘,也称之为数据库中知识发现是一个可以从海量数据中智能地和自动地抽取一些有用的、可信的、有效的和可以理解的模式的过程。分类是数据挖掘的重要内容之一。目前,分类已广泛应用于许多领域,如医疗诊断、天气预测、信用证实、顾客区分、欺诈甄别。 现已有多种分类的方法,其中决策树分类法在海量数据环境中应用最为广泛。其原因如下;1、决策树分类的直观的表示方法较容易转化为标准的数据库查询。2、决策树分类归纳的方法行之有效,尤其适合大型数据集。3、决策树在分类过程中,除了数据集中已包括的信息外,不再需要额外的信息。4、决策树分类模型的精确度较高。 数据库的急剧膨胀使得挖掘算法的可伸缩性变得日益重要,传统的挖掘算法处理的数据量较少。现代的数据库已大到不能将其数据全部调入内存。从磁盘读取数据比挖掘算法在内存中处理数据慢得多。因此挖掘算法必须是可伸缩的,否则挖掘算法的实用性会受到限制。一个算法是可伸缩的是指在一定内存的情况下,算法的运行时间随输入的记录数的增加而线性增加。 各种数据库可使数据挖掘更加有效、方便。但在关系数据库和OLAP数据仓库上建立挖掘模型并非易事,开发需要制定挖掘算法,大量的工作需要开发者完成。OLE DB for Data Mining(OLE DB for DM)是OLE DB和OLE DB for OLAP自然进化的结果。Microsoft's OLE DB for DM规范使数据挖掘工作只通过一个API完成。其目的是减轻在数据库上开发挖掘应用程序的负担。由于使用OLE DB for DM没有涉及数据库的内部细节,因此数据挖掘可方便地运行在多种数据库系统上。 本文首先研究了评估分类模型的方法。在此基础上着重研究了决策树分类方法,并对决策树算法的可伸缩性问题进行了具体分析,最后给出了基于OLE DB for DM开发决策树分类预测应用程序。
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2002
【分类号】:TP311.12

【相似文献】
中国期刊全文数据库 前10条
1 贾冬梅;刘羽;;决策树算法在棉纺质检中的应用[J];硅谷;2010年11期
2 钱网伟;;基于MapReduce的ID3决策树分类算法研究[J];计算机与现代化;2012年02期
3 迟庆云;;决策树分类算法及其应用[J];枣庄学院学报;2005年05期
4 杨学兵;张俊;;决策树算法及其核心技术[J];计算机技术与发展;2007年01期
5 吴碧霞;;一种改进的决策树分类算法研究[J];成都大学学报(自然科学版);2011年04期
6 林艳;于书举;;决策树分类算法ID3的应用研究[J];企业科技与发展;2009年08期
7 徐枫;;浅析数据挖掘分类方法中的决策树算法[J];商场现代化;2010年23期
8 巩固;张虹;;决策树算法在天气评估中的应用[J];微计算机信息;2007年34期
9 蔡春华;杨柳;;改进的决策树算法在成绩分析中的应用[J];微计算机信息;2010年36期
10 张思奇,周淑文,巩志国,董名垂;医疗数据中知识发现的研究[J];沈阳大学学报;2004年04期
中国重要会议论文全文数据库 前10条
1 滕明鑫;高占国;杨秀清;;数据挖掘中决策树算法优化研究[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
2 鲁俐;;高校档案管理工作中的一种决策树分类算法研究[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
3 冷春霞;王翰虎;;一种高效的决策树分类算法[A];第十六届全国数据库学术会议论文集[C];1999年
4 韩松来;张辉;周华平;;决策树算法中多值偏向问题的理论分析[A];全国自动化新技术学术交流会会议论文集(一)[C];2005年
5 张守娟;周诠;;空间数据挖掘决策树算法在遥感图像分类中的应用研究[A];中国遥感应用协会2010年会暨区域遥感发展与产业高层论坛论文集[C];2010年
6 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
7 金鑫;闫龙川;刘军;张书林;;基于决策树算法的企业信息系统故障自动诊断分析方法[A];2016电力行业信息化年会论文集[C];2016年
8 华勇;张云龙;;决策树算法在信息资产识别中的应用[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
9 李永立;吴冲;胡冬冬;吴世堂;;基于树形网络分析的短信种子用户挖掘模型及其实证分析[A];第十四届中国管理科学学术年会论文集(上册)[C];2012年
10 桑明茜;;决策树在财务报表分析中的应用[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 上海市浦东卫生发展研究院 孙雪松 王晓丽;数据挖掘在医学大数据研究中的应用[N];中国信息化周报;2018年
2 国网信息通信有限公司北京信息灾备中心主任 刘军 国网信息通信有限公司北京信息灾备中心常务副主任 吕俊峰;大数据时代及数据挖掘的应用[N];国家电网报;2012年
3 ;数据挖掘流程[N];人民邮电;2001年
4 陆天歌 王兆亮;数据挖掘:帮你读懂未来战争[N];解放军报;2018年
5 ;数据挖掘:如何挖出效益?[N];中国计算机报;2004年
6 本报记者 戴丽昕;在人才工作中展现数据挖掘力量[N];上海科技报;2019年
7 本报记者 林丽鹂;用大数据挖掘市场“金矿”[N];人民日报;2019年
8 本报记者 张佳星;把扎克伯格拉下水,大数据挖掘犯错了吗[N];科技日报;2018年
9 本报记者 张佳星;数据挖掘大战 机器怎么做到“见信如面”[N];科技日报;2018年
10 记者 张潇;打造数据挖掘领域的“响尾蛇模式”[N];西安日报;2018年
中国博士学位论文全文数据库 前10条
1 母亚双;分布式决策树算法在分类问题中的研究与实现[D];大连理工大学;2018年
2 姜彦;正则化方法在数据挖掘中的应用与研究[D];湖南大学;2015年
3 马昱欣;结合可视化与数据挖掘的数据分析方法探究[D];浙江大学;2017年
4 李雄;单核苷酸多态性数据挖掘方法及其应用研究[D];湖南大学;2015年
5 董瑶;基于统计分析与数据挖掘的智能优化预测研究及应用[D];兰州大学;2015年
6 黄柏文;基于数据挖掘的徐力教授治疗晚期肺癌经验总结及常用药对实验研究[D];南京中医药大学;2019年
7 王达;时间序列数据挖掘研究与应用[D];浙江大学;2004年
8 马昕;粗糙集理论在数据挖掘领域中的应用[D];浙江大学;2003年
9 王立宏;信息系统的约简与粒度分析及其在数据挖掘中的应用[D];上海大学;2004年
10 杨虎;序列数据挖掘的模型和算法研究[D];重庆大学;2003年
中国硕士学位论文全文数据库 前10条
1 胡小刚;数据挖掘中决策树分类算法的研究[D];华中师范大学;2002年
2 石鑫;决策树分类算法的研究及其在纳税评估中的应用[D];中国海洋大学;2004年
3 杨艳艳;决策树分类算法的研究及其在电力营销中的应用[D];华北电力大学;2012年
4 李小平;多关系决策树分类算法的研究[D];内蒙古大学;2011年
5 卜亚杰;决策树分类算法的研究及应用[D];华北电力大学(河北);2008年
6 冯亚;数据挖掘中决策树分类算法研究与应用[D];西北大学;2007年
7 韩松来;基于关联度函数的决策树分类算法研究[D];国防科学技术大学;2005年
8 张冬冬;基于遗传算法的决策树优化算法研究[D];兰州交通大学;2014年
9 温洁;决策树算法在银行风险监控中的应用研究[D];厦门大学;2009年
10 张青;决策树分类算法的研究与改进[D];郑州大学;2002年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026