收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于模糊理论的决策树算法的研究及应用

于振灏  
【摘要】:在数据挖掘领域,数据的分类是其研究的核心内容之一,而决策树算法,便是一种简单高效且应用比较普遍的分类算法。该算法的模型简单明朗,易于理解,可复用性强,同时具有较高的分类精度。经典的决策树算法不善于处理数据的模糊性问题,随着模糊理论在机器学习、人工智能等方面的应用,通过将模糊集合理论与决策树算法融合,诞生了模糊决策树算法,比如FuzzyID3、Min-Ambiguity算法等。模糊决策树算法的出现使经典决策树算法的应用得到拓展,对该类算法的发展有着深远的影响,使其能够处理具有不确定性的数据。论文的主要工作包括以下几点:(1)论述决策树以及模糊理论相关的基础概念,总结不同决策树算法分裂属性选取标准的差异,分析不同的决策树剪枝技术。重点比较清晰决策树与模糊决策树在建树过程、数据预处理、算法复杂度、规则匹配方式以及适用范围等方面的差异,总结它们的优缺点。(2)提出了通过K-means算法获取连续属性聚类中心点,并结合三角模糊数对连续数据模糊处理的方式。同时设计完成了基于FuzzyID3和Min-Ambiguity算法的可视化模糊决策系统。结合Weka开源数据挖掘软件中实现的C4.5和CART算法,通过实验分析,比较四种决策树算法在分类正确率和产生的规则数上的不同。实验发现FuzzyID3算法在各个数据集上都有较高的正确率,且规则数较少。CART算法生成的规则数最少,这是因为其二叉树的模型特点和以基尼指数作为分裂属性选取标准的特性。对比FuzzyID3和Min-Ambiguity两种模糊决策树算法,发现前者整体性能优于后者,同时实验分析了真实度对这两种算法的影响。(3)将模糊决策树算法应用到邮件分类中,设计了一种以FuzzyID3算法为核心,基于邮件行为特征的邮件分类模型,提出了一种邮件特征属性选取的方案和相应的模糊处理方案。通过实验验证发现,该模型在对邮件分类时具有较高的召回率和正确率,可以较为高效的识别垃圾邮件。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王曙燕,耿国华,李丙春;决策树算法在医学图像数据挖掘中的应用[J];西北大学学报(自然科学版);2005年03期
2 冯少荣;;决策树算法的研究与改进[J];厦门大学学报(自然科学版);2007年04期
3 王磊;郑任儿;;决策树算法的比较研究[J];科技信息;2012年30期
4 万川南;柳炳祥;徐星;;决策树算法在手机购买中的应用[J];内江科技;2013年09期
5 崔丽;;基于云平台的决策树算法在医疗领域中的应用[J];科技通报;2013年02期
6 李建军;吴文亮;;基于决策树算法的高校科研管理评估研究[J];科技通报;2014年03期
7 金莹;;一种改进的决策树算法及其在高校学生就业中的应用[J];合肥学院学报(自然科学版);2010年02期
8 吕爽;陈高云;吴晓;王鹏;;基于主从模式的并行决策树算法研究[J];西南民族大学学报(自然科学版);2007年04期
9 迟庆云;;一种动态的决策树算法研究[J];邵阳学院学报(自然科学版);2007年03期
10 徐健锋;刘斓;邱桃荣;刘清;;基于粒计算的二进制矩阵及在决策树算法的应用[J];广西师范大学学报(自然科学版);2008年03期
11 王鹤琴;朱萍;程代娣;;决策树算法分析及其未成年人犯罪行为分析应用[J];合肥学院学报(自然科学版);2011年01期
12 张君昊;黄继风;;基于决策树算法的多媒体教室设备故障风险评价[J];实验室研究与探索;2012年04期
13 刘璇;;决策树算法在图书馆数据统计中的应用[J];科技信息;2012年30期
14 赵艳春;;决策树算法在中职招生宣传中的应用研究[J];中国西部科技;2013年01期
15 姚晔,李翔;决策树算法的教育应用探讨[J];江西师范大学学报(自然科学版);2004年04期
16 杨胜刚;王鹏;贺学会;;决策树算法在反洗钱领域中的应用研究[J];湖南大学学报(社会科学版);2006年01期
17 冯贵良;杨洁;李忠哗;;一种基于影响度的可伸缩的决策树算法[J];河北北方学院学报(自然科学版);2008年04期
18 琚春华;肖亮;;基于地域因素的连锁商业分布式决策树算法[J];系统工程理论与实践;2011年06期
19 郑均辉;甘泉;;决策树算法在试卷分析系统中的应用[J];黑龙江科技信息;2012年34期
20 李康熙;李为山;;基于转换的错误驱动与决策树算法的句子边界自动识别[J];科技通报;2012年10期
中国重要会议论文全文数据库 前3条
1 韩松来;张辉;周华平;;决策树算法中多值偏向问题的理论分析[A];全国自动化新技术学术交流会会议论文集(一)[C];2005年
2 杨林权;吕维先;;基于决策树算法的SimuroSot决策程序设计[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
3 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
中国硕士学位论文全文数据库 前10条
1 王伟;具有降维容噪特性的决策树算法改进[D];郑州大学;2015年
2 薛砚丹;基于决策树算法的高校财务管理与决策分析研究[D];宁夏大学;2015年
3 高帆;基于面向对象决策树算法的土地利用遥感分类初步研究[D];云南师范大学;2015年
4 龙志勇;基于并行化的决策树算法优化及其应用研究[D];浙江大学;2015年
5 张敬轩;决策树算法在违约预测中的应用[D];北京理工大学;2015年
6 李伟;决策树算法应用及并行化研究[D];电子科技大学;2014年
7 张晓伟;银行卡业务分析和数据挖掘系统的设计与实现[D];电子科技大学;2014年
8 刘胜涛;地源热泵优化控制系统设计与研究[D];电子科技大学;2016年
9 李海涛;基于Hadoop的决策树算法改进及林业数据分类预测研究[D];东北林业大学;2016年
10 范志成;航空总线信息提取及优化的研究[D];中国民航大学;2012年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978