收藏本站
《南京师范大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

基于决策树的分类方法研究

戴南  
【摘要】: 数据挖掘,又称数据库中的知识发现,是指从大型数据库或数据仓库中提取具有潜在应用价值的知识或模式。模式按其作用可分为两类:描述型模式和预测型模式。分类模式是一种重要的预测型模式。挖掘分类模式的方法有多种,如决策树方法、贝叶斯网络、遗传算法、基于关联的分类方法、粗糙集和k-最临近方法等等。 本文研究如何用决策树方法进行分类模式挖掘。文中详细阐述了几种极具代表性的决策树算法:包括使用信息熵原理分割样本集的ID3算法;可以处理连续属性和属性值空缺样本的C4.5算法;依据GINI系数寻找最佳分割并生成二叉决策树的CART算法;将树剪枝融入到建树过程中的PUBLIC算法;在决策树生成过程中加入人工智能和人为干预的基于人机交互的决策树生成方法;以及突破主存容量限制,具有良好的伸缩性和并行性的SLIQ和SPRINT算法。对这些算法的特点作了详细的分析和比较,指出了它们各自的优势和不足。文中对分布式环境下的决策树分类方法进行了描述,提出了分布式ID3算法。该算法在传统的ID3算法的基础上引进了新的数据结构:属性按类别分布表,使得算法具有可伸缩性和并行性。最后着重介绍了作者独立完成的一个决策树分类器。它使用的核心算法为可伸缩的ID3算法,分类器使用Microsoft Visual C++6.0开发。实验结果表明作者开发的分类器可以有效地生成决策树,建树时间随样本集个数呈线性增长,具有可伸缩性。
【学位授予单位】:南京师范大学
【学位级别】:硕士
【学位授予年份】:2003
【分类号】:TP311.13

【相似文献】
中国期刊全文数据库 前10条
1 孙胜耀;聂利颖;;基于数据挖掘的高校学生信息海量数据处理[J];电脑知识与技术;2011年24期
2 陈海宇;郭晓伟;;数据挖掘在高职院校就业指导中的应用研究[J];湖南工程学院学报(自然科学版);2011年02期
3 黄维维;叶建伟;张宏莉;;基于ID3决策树的木马动态检测技术研究[J];智能计算机与应用;2011年03期
4 王小巍;蒋玉明;;决策树ID3算法的分析与改进[J];计算机工程与设计;2011年09期
5 李丹实;;使用SQL Server2005构建数据挖掘应用程序[J];煤炭技术;2011年07期
6 李炳燃;张金哲;;数据挖掘在设备故障诊断专家系统知识获取中的应用[J];科技信息;2011年20期
7 刘亚楠;;网络信息检索在统计中的应用[J];现代营销(学苑版);2011年08期
8 赵伦;侯波;颜昌沁;;利用ClementineC5.0模型预测CDMA客户流失[J];电脑知识与技术;2011年20期
9 张小峰;张志旺;逄珊;;基于通信系统的决策树构造算法[J];山东大学学报(工学版);2011年04期
10 佟泽华;姚伟;陈全平;;基于DW+DM融合模式的企业竞争情报系统(E-CIS)研究[J];情报杂志;2011年07期
中国重要会议论文全文数据库 前10条
1 段巍巍;;电信客户流失预测主题建模[A];第十届中国科协年会信息化与社会发展学术讨论会分会场论文集[C];2008年
2 陈平;乔秀全;刘臻;田小萍;;数据挖掘网格中决策树并行算法设计及性能分析[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年
3 姜慧;张冬艳;;决策树在建设工程款拖欠问题中的应用研究[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
4 李小明;孙金城;;数据挖掘在汉语语音合成中的应用[A];图像 仿真 信息技术——第二届联合学术会议论文集[C];2002年
5 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
6 周红梅;薛青;;数据挖掘技术及其在装备作战仿真系统中的应用[A];第五届全国仿真器学术会论文集[C];2004年
7 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
8 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
9 温国锋;李宏艳;王广成;王永生;王成华;马立强;王敏;张巍巍;宁丰荣;岱云;;数据仓库与粗集数据挖掘在建筑管理决策中的应用研究[A];决策与管理研究(2007-2008)——山东省软科学计划优秀成果汇编(第七册·上)[C];2009年
10 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
中国重要报纸全文数据库 前10条
1 ;数据挖掘:如何挖出效益?[N];中国计算机报;2004年
2 黄献东;鞍钢冷轧厂实施数据挖掘系统项目[N];中国冶金报;2011年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 北京联通宽带业务中心 杨雪艳;数据挖掘成挽留客户利器[N];通信产业报;2009年
5 早报记者 胡孝敏;跨国企业掘金中国“数据挖掘”市场[N];东方早报;2005年
6 吴勇毅;软件选型:数据挖掘是重点[N];中国冶金报;2009年
7 刘光强;靠数据挖掘抓住客户的心[N];中国计算机报;2009年
8 本报记者 郭白岩;大众点评网向数据挖掘要收益[N];中国经营报;2011年
9 赵骏飞;数据挖掘在金融行业的应用[N];中国保险报;2011年
10 本报记者 黎宇文;博时基金王德英: 数据挖掘促进基金精细化管理[N];中国证券报;2011年
中国博士学位论文全文数据库 前10条
1 黄定轩;企业核心能力智能挖掘应用基础研究[D];西南交通大学;2005年
2 王曙燕;医学图像智能分类算法研究[D];西北大学;2006年
3 李兴森;智能知识及其管理模式研究[D];中国科学院研究生院;2008年
4 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
5 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
6 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
7 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
8 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
9 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
10 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
中国硕士学位论文全文数据库 前10条
1 赵亚梅;数据挖掘在工程数据分析中的应用研究[D];东华大学;2005年
2 崔继凯;零售业中OLAP和数据挖掘若干算法的研究与实现[D];西安电子科技大学;2004年
3 山波;数据挖掘在GZXDE-DM模型中的实现[D];上海海运学院;2001年
4 贾亚莉;基于粗糙集的多变量决策树的应用研究[D];合肥工业大学;2005年
5 王永生;数据挖掘在考试系统中的应用[D];北京工业大学;2005年
6 迟庆云;基于决策树的分类算法研究和应用[D];山东师范大学;2005年
7 成华;数据挖掘在糖尿病数据中的应用研究[D];中国科学院研究生院(软件研究所);2003年
8 李洋;基于数据挖掘的邮件分类识别研究[D];重庆大学;2004年
9 魏涛;基于决策树的教育信息挖掘模型(DT-EIDM)的设计与实现[D];上海海事大学;2005年
10 李瑞录;数据挖掘技术在人口信息系统中的应用[D];吉林大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026