收藏本站
《合肥工业大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于粗糙集合理论的决策树构造算法研究

张冬艳  
【摘要】:数据库知识发现是(Knowledge Discovery in Databases,简称KDD)是当前涉及人工智能和数据库等学科的一门相当活跃的研究领域,分类是其中的一个重要研究方向。决策树是分类中常用的模型之一,自1966年被提出以来已经得到了广泛的研究和应用。然而,由于其种类偏见和抗噪性差等问题,使决策树优化成为研究人员关注的热点。 本文基于粗糙集合理论对决策树构造算法的优化问题展开研究,主要工作如下: 1.综述并分析了现有决策树经典算法及优化算法。 2.提出了混合变量决策树结构,并基于该结构提出了基于粗集的混合变量决策树算法RSH及其改进算法RSH2。RSH算法遍历所有的属性子集,选择尽可能少的属性明确划分尽可能多的实例;RSH2通过对属性的预排序,不用遍历所有的属性子集,因而可以快速地得到最佳的属性组合。 3.针对传统决策树抗噪性较差的问题,基于可变精度粗集模型提出了VPRsDt算法,利用粗糙集合的相关理论来进行决策树分裂属性的选择和剪枝,将变精度正域作为属性选择判据,减小了噪音对属性选择的影响;将多数包含关系作为决策树停止分裂的标准,减少了特例化的规则而不会影响模型的预测能力,避免了过度拟合问题,同时减小了决策树规模。 4.基于上述研究,实现了原型系统,从理论和实验上证明了所提出的算法的正确性和有效性。
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP182

知网文化
【引证文献】
中国期刊全文数据库 前5条
1 彭莉芬;陈俊生;胡学钢;;基于粗糙集决策树算法的研究[J];安庆师范学院学报(自然科学版);2012年01期
2 韦萍萍;;结合ROUGH集的决策树构建方法[J];重庆工学院学报(自然科学版);2007年09期
3 张洋;陈培友;;基于粗糙集理论的决策树方法在贷款客户信用评估中的应用[J];科技和产业;2008年01期
4 王秀慧;许彩欣;;决策树在贷款客户信用评估中的应用[J];现代计算机(专业版);2011年09期
5 滕玮;;决策树算法在银行信用评估中的研究[J];无线互联科技;2013年02期
中国硕士学位论文全文数据库 前1条
1 徐邵兵;纳税信用等级评定分类方法应用研究[D];合肥工业大学;2007年
【参考文献】
中国期刊全文数据库 前4条
1 王熙照,游自英;决策树简化(剪切)方法综述[J];计算机工程与应用;2004年27期
2 洪家荣,丁明峰,李星原,王丽薇;一种新的决策树归纳学习算法[J];计算机学报;1995年06期
3 苗夺谦,王珏;基于粗糙集的多变量决策树构造方法[J];软件学报;1997年06期
4 刘小虎,李生;决策树的优化算法[J];软件学报;1998年10期
【共引文献】
中国期刊全文数据库 前10条
1 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
2 赵彦辉;张乐文;邱道宏;仲晓杰;;基于粗糙集理论的隧道围岩模糊综合评判[J];四川建筑科学研究;2011年02期
3 吕俊;任雪萍;;一种基于粗糙集理论的变压器故障多变量决策树诊断方法[J];安徽电气工程职业技术学院学报;2011年01期
4 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
5 于海涛;Rough集理论在数据约简中的应用[J];安徽教育学院学报;2004年03期
6 赵鹏,倪志伟,贾瑞玉;基于数据挖掘技术的范例库维护[J];安徽大学学报(自然科学版);2003年02期
7 程家兴,钱付兰;粗糙集方法在基于属性分类中的应用[J];安徽大学学报(自然科学版);2005年01期
8 孟庆全;徐文龙;;粗糙集合在中医诊断中的应用研究[J];安徽大学学报(自然科学版);2006年04期
9 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
10 梁佩佩,杨丽萍;基于模糊关系数据库的聚类算法研究[J];安徽职业技术学院学报;2004年01期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 尹宗成;;粗糙集理论在我国粮食产量预测中的应用[A];现代农业理论与实践——安徽现代农业博士科技论坛论文集[C];2007年
4 危前进;董荣胜;孟瑜;崔更申;;基于粗糙集的机械装配知识发现方法[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
5 吕思颖;刘载文;王小艺;崔莉凤;;基于Elman神经网络的水华短期预测模型[A];第二十七届中国控制会议论文集[C];2008年
6 王印松;冯康;;主汽温调节系统性能评价的粗糙集实现方法[A];第二十七届中国控制会议论文集[C];2008年
7 方炜炜;杨炳儒;彭珍;;一种基于粗糙集的启发式属性归约的新算法[A];第二十七届中国控制会议论文集[C];2008年
8 何鹏;王雅琳;桂卫华;孔玲爽;;氧化铝硅渣成分的混沌时间序列分析与SVM预测[A];第二十九届中国控制会议论文集[C];2010年
9 龚锦红;杨辉;衷路生;;稀土萃取分离过程的Rough集案例推理方法[A];第二十九届中国控制会议论文集[C];2010年
10 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
4 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
5 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
6 杨锦园;基于传感器管理的移动机器人融合算法研究[D];华中科技大学;2010年
7 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
8 任家福;服务商选择与备件备品库存管理研究[D];电子科技大学;2010年
9 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
10 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
3 杨新忠;基于案例的地理时空过程表达模型研究[D];山东科技大学;2010年
4 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
5 雷聪聪;一种基于数据聚类的信息粒化方法[D];郑州大学;2010年
6 张晓冬;基于全矢谱的智能诊断技术研究[D];郑州大学;2010年
7 王晓换;基于粗糙集和神经网络的故障诊断虚拟系统的研究[D];郑州大学;2010年
8 周霞;基于粗糙集的电子商务交易知识获取研究[D];哈尔滨工程大学;2010年
9 冯为军;基于粗糙集理论的数据挖掘算法的研究[D];哈尔滨工程大学;2010年
10 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 江效尧,胡林生;基于粗糙集的RDT决策树生成算法的研究及应用[J];安徽工程科技学院学报(自然科学版);2004年03期
2 赵卫东,盛昭瀚,何建敏;粗糙集在决策树生成中的应用[J];东南大学学报(自然科学版);2000年04期
3 王熙照,游自英;决策树简化(剪切)方法综述[J];计算机工程与应用;2004年27期
4 丁德恒;;大规模数据库中的知识获取[J];计算机科学;1994年05期
5 陈栋;刘兵;徐洁磐;;KDD研究现状及发展[J];计算机科学;1996年06期
6 张维东,张凯,董青,孙维华;利用决策树进行数据挖掘中的信息熵计算[J];计算机工程;2001年03期
7 刘军丽;陈翔;;基于决策树的个人住房贷款信用风险评估模型[J];计算机工程;2006年13期
8 鲁为;王枞;;决策树算法的优化与比较[J];计算机工程;2007年16期
9 蒋芸,李战怀,张强,刘扬;一种基于粗糙集构造决策树的新方法[J];计算机应用;2004年08期
10 唐华松,姚耀文;数据挖掘中决策树算法的探讨[J];计算机应用研究;2001年08期
中国硕士学位论文全文数据库 前3条
1 张卿;基于分布式概念格模型的数据挖掘研究[D];合肥工业大学;2002年
2 王名扬;基于粗糙集理论的决策树生成与剪枝方法[D];东北师范大学;2005年
3 史君华;基于粗糙集理论的约简方法研究[D];合肥工业大学;2007年
【二级引证文献】
中国期刊全文数据库 前3条
1 王越;万洪;;一种新的应用变精度粗糙集的决策树构造方法[J];重庆理工大学学报(自然科学);2013年11期
2 张学友;苗强;毛军军;;基于粗糙度的一种分形维数计算方法[J];计算机技术与发展;2010年05期
3 魏凤江;崔壮;李长平;宋春华;朱宝;刘媛媛;马骏;;决策树模型与回归模型在天津市某区公务员健康状况分析中的应用与比较[J];中国卫生统计;2013年01期
中国硕士学位论文全文数据库 前8条
1 张学友;基于粒度计算的属性约简及实证分析[D];安徽大学;2010年
2 魏凤江;天津市某区公务员健康状况及影响因素分析[D];天津医科大学;2010年
3 朱佳逸;企业税务信息披露研究[D];杭州电子科技大学;2013年
4 史嘉敏;W公司赊销信用风险管理案例分析[D];华南理工大学;2013年
5 张佳瑶;基于聚类的数据挖掘技术在税源监控中的应用[D];财政部财政科学研究所;2013年
6 刘通;基于样本集优化的个人信用贝叶斯网络评分模型研究[D];哈尔滨工业大学;2013年
7 汤希;数据挖掘在农村商业银行信贷管理中的应用[D];湖南大学;2013年
8 毛凯;企业信用风险评估方法研究[D];中南大学;2013年
【相似文献】
中国期刊全文数据库 前2条
1 戴君琴;面向CRM的数据挖掘技术的应用[J];情报杂志;2004年07期
2 崔杰,张颍;数据挖掘技术在CRM中的运用[J];辽宁工学院学报(自然科学版);2002年06期
中国博士学位论文全文数据库 前2条
1 巩垠熙;多元林业信息融合的立地知识发现研究[D];北京林业大学;2013年
2 张谷丰;基于WebGis的农作物病虫预警诊断平台[D];南京农业大学;2009年
中国硕士学位论文全文数据库 前10条
1 王晓平;基于粗糙集的决策树优化算法研究[D];四川师范大学;2013年
2 尹洪泽;基于核心示例集的属性约简方法研究[D];河北科技大学;2012年
3 王强;决策树过拟合问题研究[D];合肥工业大学;2008年
4 张国荣;基于粗糙集的数据挖掘算法研究与应用[D];西北师范大学;2011年
5 王楚;基于改进决策树的入侵检测算法的研究[D];东北大学;2011年
6 郑利锋;数据挖掘在海南旅游服务管理中的应用与实现[D];电子科技大学;2012年
7 张峰;基于数据挖掘技术的教学管理应用研究[D];合肥工业大学;2010年
8 谢凯;基于聚类的数据预处理对模糊决策树归纳的影响[D];河北大学;2006年
9 余昌瑾;图像挖掘技术研究与应用[D];武汉理工大学;2010年
10 李兰晓;面向手语视频拼接的过渡视频库构建方法研究[D];北京工业大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026