收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于公理模糊集的模糊决策树算法研究

冯兴华  
【摘要】:分类问题是机器学习和数据挖掘等领域的研究热点。决策树(Decision Tree)是最重要的分类算法之一,其优点在于分类精度高且具有可解释性。决策树在商业决策、医疗诊断分析等方面有着广泛的应用。公理模糊集(Axiomatic Fuzzy Sets, AFS)理论是一种处理模糊信息的新语义方法,其本质是研究如何把蕴含在训练数据或数据库中的内在规律或模式转化到模糊集及其逻辑运算中。AFS理论已经应用到知识表示、聚类分析、模糊分类等方面。本文结合AFS理论提出了几种基于决策树的模糊分类算法,另外还对分类问题中涉及的数据预处理及分类器评价问题进行了研究。本文主要研究工作包括: 1.在AFS理论框架下,提出了一种模糊决策树分类器,称为AFS决策树。AFS决策树在阈值δ使用最大模糊信息增益选择节点的分裂属性,因此树结构受到阈值δ的影响。应用遗传算法优化参数δ,即优化AFS决策树的结构,使其在保证准确率的基础上尽可能的选择较小规模的决策树。另外给出了确定叶子节点类标签的新方法,将叶子节点所“覆盖”训练样本的主要类别作为其类标签。最后提出了一个置信度函数对分类结果进行分析,给出分类结果的可信程度。AFS理论的引入,使得该分类器可以应用到离散、连续、布尔、序关系等形式的数据上,且模糊集的隶属函数由AFS理论依据数据自动给出。在28个UCI数据集上和SVM、KNN、C4.5、FDTs、FS-DT、FARC及FURIA分类算法进行了实验比较。实验结果的统计分析显示,该算法能够获得最高的分类准确率,且显著地好于KNN、C4.5、FDTs和FS-DT算法。 2.决策树分类算法的关键技术是如何选择节点的分裂属性。利用模糊集合的模糊度,提出了基于闵可夫斯基模糊度的模糊决策树分类方法。将决策树的节点视作各类样本分布频率的模糊集合,利用闵可夫斯基模糊度来监测节点分裂前后模糊度的变化,选择能使闵可夫斯基模糊度下降最多的属性作为该节点的分裂属性。另外,从理论上证明了阈值δ与树结构之间的关系:如果δ1δ2,那么δ1对应的决策树可由δ2对应的决策树通过恰当地删减子树得到。这为通过剪枝优化树结构,寻找较小的决策树提供了理论基础。通过在16个UCI数据集上和基于GINI index和Min-Ambiguity分裂属性选择标准的模糊决策树的比较发现,与上述两种模糊决策树相比,基于闵可夫斯基模糊度的决策树在取得较高的分类准确率的同时也能得到较小的决策树。 3.在模型树分类算法和AFS理论基础上,提出了AFS based Pattern Tree Rules (AFSPTR)分类算法。该算法通过模糊概念的聚合产生模糊分类规则,聚合前用AFS隶属函数依数据对特征空间进行模糊划分,然后利用新的聚合目标函数对模糊概念进行聚合。聚合目标函数由模糊相似度和模糊熵度量两部分组成,一方面刻画了聚合结果与目标类别之间的相似性,另一方面描述了在聚合结果下目标类别与其他类别之间的相异性,这实质上是AFSPTR在准确性和简单性之间的一种平衡。在8个UCI数据集上和C4.5、Decision Table、JRip、NNge、OneR、PART及Ridor七种基于分类规则的分类器进行了准确率、规则集复杂度的比较。统计结果表明,AFSPTR算法在8个数据集上得到了最小的分类规则集,且其分类准确率显著地好于Decision Table和OneR方法. 4.首先提出了一种基于仿射传播聚类的样本选择方法(APIS).APIS将训练数据聚为若干类别,将所有的类代表样本作为新训练样本训练分类器。其次提出了一种基于特征空间划分相似度的分类规则集一致性评价方法。先用分类规则将特征空间进行划分,然后找出每条分类规则的核空间,最后通过不同规则集的核空间的相似度来确定两个规则集的一致性。这种一致性不仅可以用来评价两个规则集的分类知识是否一致、判断已有的规则知识库是否需要更新,而且还可以作为选择分类器的依据。实验部分在17个数据集上比较了5种决策树算法之间的相似性,验证了C4.5算法在不同数据集上的一致性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵明华,孙娟,杨宏伟,王熙照;模糊决策树中参数对模糊熵的敏感性分析[J];计算机工程;2003年11期
2 杨杨;赵政;;模糊决策树在公共危机应急系统中的应用[J];计算机应用;2006年10期
3 王金凤,王熙照;两种模糊决策树算法的对比研究[J];计算机工程与应用;2003年29期
4 王熙照,谢竞博;基于属性间交互信息的模糊ID3算法的扩展(英文)[J];复旦学报(自然科学版);2004年05期
5 姚笑秋;何仁刚;陆秋;;模糊决策树在高校师资管理中的应用[J];计算机技术与发展;2007年05期
6 国宏伟;刘燕驰;梁合兰;武森;;多变量时间序列的模糊决策树挖掘[J];计算机应用研究;2009年01期
7 娄臻亮,张永清;模糊决策树算法及其在注塑模浇口设计中的知识获取[J];上海交通大学学报;1999年07期
8 袁修久;张文修;;输出为可能性分布的模糊决策树[J];计算机科学;2003年10期
9 薛林雁;刘爽;李超;刘霜;;模糊决策树匹配算子的推理能力对比研究[J];河北大学学报(自然科学版);2008年04期
10 常志朋;;基于模糊决策树的出口纺织品反倾销预警系统[J];计算机工程与应用;2009年25期
11 王谦;周德云;张堃;;基于模糊决策树的UCAV雷达模式管理算法[J];计算机仿真;2011年03期
12 王兴伟;原常青;黄敏;;一种基于模糊决策树的运动预测机制[J];计算机科学;2005年09期
13 孙娟;王熙照;;规则简化与模糊决策树剪枝的比较[J];计算机工程;2006年12期
14 冯楠;李敏强;寇纪淞;方德英;;一种基于模糊决策树的软件成本估计模型[J];计算机工程与应用;2007年26期
15 徐晓丽;舒赜;钟秉林;;模糊决策树在磨削状态识别中的应用[J];微计算机信息;2008年19期
16 夏侯士戟;陈东义;王厚军;;基于可穿戴计算的车间作业辅助应用研究[J];计算机工程与应用;2008年29期
17 刘在强;林东岱;冯登国;;一种用于网络取证分析的模糊决策树推理方法(英文)[J];软件学报;2007年10期
18 王煜,王正欧;基于模糊决策树的文本分类规则抽取[J];计算机应用;2005年07期
19 王熙照;董彦军;;模糊决策树的等效剪枝研究[J];计算机工程与应用;2006年07期
20 朱参世;李响;;自适应模糊决策树算法在数据流挖掘中的应用[J];现代电子技术;2010年10期
中国重要会议论文全文数据库 前10条
1 张立伟;冀海峰;黄志尧;王保良;李海青;;基于模糊数学的水质评价方法研究[A];中国仪器仪表学会第十一届青年学术会议论文集[C];2009年
2 王帅;惠兴杰;李晓奇;;一个导出的贴近度公式[A];第九届中国青年信息与管理学者大会论文集[C];2007年
3 钟育彬;郑津;;模糊认知图及其应用[A];中国系统工程学会模糊数学与模糊系统委员会第五届年会论文选集[C];1990年
4 吴海玉;张曙光;;对清晰集的运算性质的讨论[A];第九届中国青年信息与管理学者大会论文集[C];2007年
5 徐炜;贺占庄;黄士坦;;基于模糊相似计算的快速图像匹配[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
6 刘晓东;;基于AFS代数和AFS结构的模糊理论[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
7 李永明;史忠科;;用模糊子集度确定模糊似然函数的二种方法[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
8 赵磊;梁德群;谭伟;;均值滤波器中模糊集的应用[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
9 林宗振;;模糊集单调型分解定理[A];中国中南地区模糊数学与系统分会第二届年会论文集[C];1993年
10 王泉德;朱绍文;胡宏银;黄浩;陆玉昌;张大斌;;模糊集在关联规则采掘的连续属性离散化中的研究[A];1999年中国智能自动化学术会议论文集(上册)[C];1999年
中国博士学位论文全文数据库 前10条
1 冯兴华;基于公理模糊集的模糊决策树算法研究[D];大连理工大学;2013年
2 王美珍;垃圾邮件行为模式识别与过滤方法研究[D];华中科技大学;2009年
3 戴鹏;货车典型故障图像识别算法研究[D];哈尔滨工业大学;2010年
4 戴鹏;货车典型故障图像识别算法研究[D];哈尔滨工业大学;2010年
5 商有光;n维模糊集的基础理论及其应用[D];大连理工大学;2012年
6 王莉;基于粗糙—模糊集成的分类知识发现[D];南京大学;2013年
7 苏宏升;软计算方法及其在电力系统故障诊断中的若干应用研究[D];西南交通大学;2007年
8 王涛;数据流挖掘分类方法关键技术研究[D];国防科学技术大学;2007年
9 王晓锋;Web应用入侵异常检测新技术研究[D];华中科技大学;2007年
10 孙伟;XML数据库查询优化及相关技术研究[D];哈尔滨工程大学;2006年
中国硕士学位论文全文数据库 前10条
1 张朝杰;一种基于模糊决策树的软件工作量估算方法[D];国防科学技术大学;2010年
2 钟蜜;基于模糊决策树的热轧工艺关键变量的分析与提取[D];武汉科技大学;2011年
3 赵明华;模糊决策树产生过程中参数的敏感性分析[D];河北大学;2003年
4 谢竞博;关于模糊决策树生成过程中启发式算法的研究[D];河北大学;2004年
5 郭玉滨;基于离散度的决策树算法改进[D];山东科技大学;2005年
6 张俊丰;入侵检测模糊分类算法研究[D];太原理工大学;2007年
7 袁英;模糊决策树在采煤机故障诊断中的应用研究[D];太原科技大学;2009年
8 常志朋;中国出口纺织品应对欧盟反倾销预警系统研究[D];华北电力大学(河北);2007年
9 杨静;数据挖掘在输变电管理系统中的应用研究[D];华北电力大学(河北);2006年
10 赵旺明;数据挖掘在军队干部能力素质培训系统中的应用研究[D];昆明理工大学;2008年
中国重要报纸全文数据库 前10条
1 黄明;精子分类器决定生男生女[N];广东科技报;2000年
2 中国水利水电科学研究院水资源研究所所长、中国工程院院士 王浩;一部有创新性的力著[N];科技日报;2006年
3 CPW 张戈;Aperto PacketMAX系列可同时服务2000个用户[N];电脑商报;2005年
4 记者 姜晓凌 见习记者 王毅俊;原来,科技也能如此美丽[N];上海科技报;2007年
5 中国科学院东北地理与农业生态研究所 李建平;保护地球之肾 遥感体检湿地健康[N];中国水利报;2008年
6 武德锋 李国辉 林洪文 姚作梁;图像世界任我行[N];计算机世界;2002年
7 ;模糊计算不“含糊”[N];计算机世界;2003年
8 中科院院士 戴汝为;开辟人机结合的新天地[N];计算机世界;2004年
9 本版编辑 中国科学院计算技术研究所数字媒体研究中心 山世光 陈熙霖 高文 徐昕 刘洪宇;你的脸,你的身份证明[N];中国计算机报;2006年
10 清华大学 朱健翔;人脸表情估计与表情合成[N];计算机世界;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978