收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于决策树的数据挖掘算法优化研究

王威  
【摘要】:数据挖掘是利用分析工具从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中、事先未知、但又潜在有用的信息和知识的过程,建立数据间关系模型,并用其做出预测。决策树模型是数据挖掘中最常用的一种方法。它能够直接体现数据的特点,便于理解,具有较好的分类预测能力,并能方便提取决策规则。 决策树的生成过程也就是知识发现的过程,决策树模型的复杂度和预测精度决定了决策树的好坏。决策树是根据启发规则生成的,常见的决策树生成算法有基于信息论的ID3、C4.5算法以及基于最小GINI指标的CART、SLIQ、PUBLIC方法。最优决策树的生成作为一类NP问题,目前又引入了一些新的技术和方法作为启发规则如:遗传算法、相关分析等,并对现有启发规则的计算做了一定的简化,同时对决策规则的完备性也进行了初步探讨。 为了从大量的属性中找出决策规则,论文首先引入粗糙集理论,对测试属性进行约简,找出真正影响决策的属性,减小决策树的规模。并根据相似性原理,以测试属性和决策属性的相似度作为启发规则构建决策树。并在高校教师综合考评系统中采用了这种新算法,实验结果表明这种新的决策树生成算法较ID3算法的预测精度更高,计算更加简便。论文最后较为详细的介绍了教师综合评价决策树的具体实现过程。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 徐钰;刘法伦;;基于数据挖掘的客户关系管理设计与研究[J];科技信息;2009年04期
2 张晖;;基于决策树的数据挖掘在电信CRM中的应用研究[J];电脑开发与应用;2006年11期
3 张文钢;谷军;;分类数据挖掘综述及应用[J];太原师范学院学报(自然科学版);2006年03期
4 陈秋明;;数据挖掘在常旅客系统中的应用[J];计算机系统应用;2007年01期
5 李磊;赵瑞芬;;基于决策树的数据挖掘在入侵检测系统中的应用研究[J];技术与市场;2008年08期
6 刘慧巍;张雷;翟军昌;;数据挖掘中决策树算法的研究及其改进[J];辽宁师专学报(自然科学版);2005年04期
7 胡江洪;詹超;;数据挖掘中决策树算法的研究及其改进[J];计算机与信息技术;2005年09期
8 王晓燕;吴应清;;数据挖掘技术分析及其应用评价[J];办公自动化;2007年06期
9 王冬梅;;数据挖掘在医院信息系统中的研究与应用[J];科学技术与工程;2007年11期
10 邹少军;;数据挖掘与决策树在银行CRM中的设计与实现[J];电脑知识与技术;2009年33期
11 黄芳;;决策树技术在学生成绩分析中的应用研究[J];科技信息;2011年03期
12 刘欣阳;王国仁;乔百友;韩东红;;决策树的并行训练策略[J];计算机科学;2004年08期
13 李强;;创建决策树算法的比较研究——ID3,C4.5,C5.0算法的比较[J];甘肃科学学报;2006年04期
14 谢茂强;黄亚楼;;适应类别增量的决策树训练算法[J];计算机工程;2006年17期
15 郑荔平;;基于分类的客户响应分析[J];福建电脑;2010年01期
16 潘浩;蔺莉;;基于决策树的毕业生课程优化算法设计[J];信息技术;2010年08期
17 孙友友;郭晓燕;;决策树与聚类算法在数据挖掘中的研究及应用[J];科技创新导报;2007年34期
18 王海燕;王慧颖;;数据挖掘研究进展及其发展趋势[J];科技广场;2009年09期
19 李光;王亚东;苏小红;;隐私保持的决策树分类挖掘[J];电子学报;2010年01期
20 彭玉楼,刘亚辉;利用决策树和聚类理论对XML文档数据挖掘的研究[J];株洲工学院学报;2005年04期
中国重要会议论文全文数据库 前10条
1 段巍巍;;电信客户流失预测主题建模[A];第十届中国科协年会信息化与社会发展学术讨论会分会场论文集[C];2008年
2 陈平;乔秀全;刘臻;田小萍;;数据挖掘网格中决策树并行算法设计及性能分析[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年
3 姜慧;张冬艳;;决策树在建设工程款拖欠问题中的应用研究[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
4 李小明;孙金城;;数据挖掘在汉语语音合成中的应用[A];图像 仿真 信息技术——第二届联合学术会议论文集[C];2002年
5 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
6 周红梅;薛青;;数据挖掘技术及其在装备作战仿真系统中的应用[A];第五届全国仿真器学术会论文集[C];2004年
7 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
8 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
9 温国锋;李宏艳;王广成;王永生;王成华;马立强;王敏;张巍巍;宁丰荣;岱云;;数据仓库与粗集数据挖掘在建筑管理决策中的应用研究[A];决策与管理研究(2007-2008)——山东省软科学计划优秀成果汇编(第七册·上)[C];2009年
10 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
中国博士学位论文全文数据库 前10条
1 黄定轩;企业核心能力智能挖掘应用基础研究[D];西南交通大学;2005年
2 王曙燕;医学图像智能分类算法研究[D];西北大学;2006年
3 李兴森;智能知识及其管理模式研究[D];中国科学院研究生院;2008年
4 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
5 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
6 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
7 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
8 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
9 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
10 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
中国硕士学位论文全文数据库 前10条
1 赵亚梅;数据挖掘在工程数据分析中的应用研究[D];东华大学;2005年
2 崔继凯;零售业中OLAP和数据挖掘若干算法的研究与实现[D];西安电子科技大学;2004年
3 山波;数据挖掘在GZXDE-DM模型中的实现[D];上海海运学院;2001年
4 贾亚莉;基于粗糙集的多变量决策树的应用研究[D];合肥工业大学;2005年
5 王永生;数据挖掘在考试系统中的应用[D];北京工业大学;2005年
6 迟庆云;基于决策树的分类算法研究和应用[D];山东师范大学;2005年
7 成华;数据挖掘在糖尿病数据中的应用研究[D];中国科学院研究生院(软件研究所);2003年
8 李洋;基于数据挖掘的邮件分类识别研究[D];重庆大学;2004年
9 魏涛;基于决策树的教育信息挖掘模型(DT-EIDM)的设计与实现[D];上海海事大学;2005年
10 李瑞录;数据挖掘技术在人口信息系统中的应用[D];吉林大学;2005年
中国重要报纸全文数据库 前10条
1 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
2 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
3 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978