收藏本站
《辽宁师范大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

信息论在粗糙集连续属性离散化中的应用

岳海亮  
【摘要】: 知识发现是当前计算机科学与人工智能领域最为活跃的研究课题之一,粗糙集由于其特有的优势,成为了知识发现领域非常重要的理论。而连续属性离散化是利用粗糙集进行知识获取所必要的数据预处理阶段。本文以知识发现为引子,以粗糙集和信息论为理论基础,以决策表下连续属性离散化为研究对象,提出了两种基于信息论的决策表连续属性离散化算法。算法运用了信息论的相关概念,保证了在离散化的过程中信息的低损失度和数据处理的高效性,并通过合理的实验验证了本文算法的有效性。 本文的主要工作如下: 1论述研究背景,指出粗糙集在处理连续属性数据时的局限性,并对离散化算法的研究现状进行了综合探讨; 2介绍粗糙集的重要表示形式——决策表,指出决策表对知识发现的重要性,并给出在决策表下连续属性离散化的形式化定义。 3介绍信息论的基本概念,给出了知识的信息化表示,在此基础上对粗糙集中的主要概念和运算进行了信息化的描述,证明了粗糙集的代数表示与信息表示之间的在属性约简下的相关性。 4提出了两种基于信息论的决策表连续属性离散化算法,两种算法都是运用了信息论中的统计学概念,并以决策表的不一致率为停止条件,在高效离散的基础上保证了决策表的不相容性不发生改变; 5在VC++6.0环境下实现了本文提出的两个算法,并对离散化后的数据利用DMBench平台下C4.5与SVM进行分类处理,与其他算法离散后数据分类结果进行比较,证明了本文提出算法的有效性
【学位授予单位】:辽宁师范大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP18

【参考文献】
中国期刊全文数据库 前10条
1 王立宏;孙立民;孟佳娜;;数值离散化中粒度熵与分类精度的相关性[J];重庆大学学报;2008年01期
2 岳海亮;闫德勤;;信息偏差在连续属性离散化中的应用[J];计算机工程与应用;2010年20期
3 岳海亮;闫德勤;;一种基于信息论的决策表连续属性离散化算法[J];计算机科学;2010年04期
4 王国胤,于洪,杨大春;基于条件信息熵的决策表约简[J];计算机学报;2002年07期
5 谢宏,程浩忠,牛东晓;基于信息熵的粗糙集连续属性离散化算法[J];计算机学报;2005年09期
6 王珏,袁小红,石纯一,郝继刚;关于知识表示的讨论[J];计算机学报;1995年03期
7 高新波,谢维信;模糊聚类理论发展及应用的研究进展[J];科学通报;1999年21期
8 何亚群,胡寿松;粗糙集中连续属性离散化的一种新方法[J];南京航空航天大学学报;2003年02期
9 苗夺谦,王珏;粗糙集理论中概念与运算的信息表示[J];软件学报;1999年02期
10 赵静娴;倪春鹏;詹原瑞;杜子平;;一种高效的连续属性离散化算法[J];系统工程与电子技术;2009年01期
【共引文献】
中国期刊全文数据库 前10条
1 徐文婷;李承鹏;;基于自适应遗传算法的离散化方法[J];合肥师范学院学报;2011年03期
2 华文立;胡学刚;;平衡决策树分类精度与规则简易性研究[J];安徽电子信息职业技术学院学报;2006年04期
3 蔡莉;胡学钢;;一种基于粗集的决策表求核算法[J];安徽大学学报(自然科学版);2007年06期
4 周玉华;李景杰;;不完备决策表的一种属性约简方法[J];安徽大学学报(自然科学版);2009年04期
5 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
6 杨萍,万上海,陈耿;一种基于可变支持度的缺省规则挖掘算法[J];安徽工程科技学院学报(自然科学版);2004年02期
7 江效尧,胡林生;基于粗糙集的RDT决策树生成算法的研究及应用[J];安徽工程科技学院学报(自然科学版);2004年03期
8 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
9 孙全玲;基于粗集和神经网络的建模方法研究[J];安徽建筑工业学院学报(自然科学版);2005年02期
10 孙虹;方敏;;基于Rough集和RBF网络的车牌字符识别方法[J];安徽建筑工业学院学报(自然科学版);2006年04期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 危前进;董荣胜;孟瑜;崔更申;;基于粗糙集的机械装配知识发现方法[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
3 ;Fuzziness in Covering Generalized Rough Sets[A];第二十六届中国控制会议论文集[C];2007年
4 周绮凤;林成德;罗林开;彭洪;;一种基于黎曼度量的训练样本类不平衡SVM分类方法研究[A];第二十六届中国控制会议论文集[C];2007年
5 李雄;党生;;基于Rough集理论的战场侦察情报处理[A];第二十六届中国控制会议论文集[C];2007年
6 王印松;冯康;;主汽温调节系统性能评价的粗糙集实现方法[A];第二十七届中国控制会议论文集[C];2008年
7 方炜炜;杨炳儒;彭珍;;一种基于粗糙集的启发式属性归约的新算法[A];第二十七届中国控制会议论文集[C];2008年
8 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
9 龚锦红;杨辉;衷路生;;稀土萃取分离过程的Rough集案例推理方法[A];第二十九届中国控制会议论文集[C];2010年
10 ;Influence Diagram Based on Rough Set Theory[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 母丽华;煤矿安全预警系统的方法研究[D];哈尔滨工程大学;2010年
3 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
4 姜延吉;多传感器数据融合关键技术研究[D];哈尔滨工程大学;2010年
5 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
6 徐红林;基因调控网络的建模及其结构分解方法研究[D];江南大学;2010年
7 李鹤喜;基于视觉反馈的焊接机器人自主示教关键技术研究[D];华南理工大学;2010年
8 郑光辉;江苏部分地区土壤属性高光谱定量估算研究[D];南京大学;2011年
9 任家福;服务商选择与备件备品库存管理研究[D];电子科技大学;2010年
10 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 厉颖;基于本体的服装领域知识表示的建模研究[D];山东科技大学;2010年
2 田文娟;基于支持向量机的人民币序列号识别方法的研究[D];山东科技大学;2010年
3 杨新忠;基于案例的地理时空过程表达模型研究[D];山东科技大学;2010年
4 易明;地震作用下渡槽结构的动力可靠度分析[D];郑州大学;2010年
5 李光远;基于在线聚类和最小二乘支持向量机的模糊建模方法研究[D];郑州大学;2010年
6 张晓冬;基于全矢谱的智能诊断技术研究[D];郑州大学;2010年
7 李昕哲;关系邻域系统的属性约简[D];郑州大学;2010年
8 王林吉;基于CIELAB均匀颜色空间和聚类算法的混纺测色研究[D];浙江理工大学;2010年
9 刘琪;正态云模型模糊推理系统及其应用研究[D];郑州大学;2010年
10 王晓换;基于粗糙集和神经网络的故障诊断虚拟系统的研究[D];郑州大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 王建芬,曹元大;支持向量机在大类别数分类中的应用[J];北京理工大学学报;2001年02期
2 刘健庄;基于二维直方图的图象模糊聚类分割方法[J];电子学报;1992年09期
3 裴继红,范九伦,谢维信;一种新的高效软聚类方法:[J];电子学报;1998年02期
4 苗夺谦,胡桂荣;知识约简的一种启发式算法[J];计算机研究与发展;1999年06期
5 侯利娟;王国胤;聂能;吴渝;;粗糙集理论中的离散化问题[J];计算机科学;2000年12期
6 李刚,童頫;基于混合概率模型的无监督离散化算法[J];计算机学报;2002年02期
7 王国胤,于洪,杨大春;基于条件信息熵的决策表约简[J];计算机学报;2002年07期
8 谢宏,程浩忠,牛东晓;基于信息熵的粗糙集连续属性离散化算法[J];计算机学报;2005年09期
9 皋军,王建东;一种基于云模式连续型属性离散化的算法[J];计算机应用;2004年02期
10 王立宏,吴彦,吴耿锋;离散格的一种启发式搜索算法[J];计算机应用;2004年08期
中国博士学位论文全文数据库 前1条
1 裴继红;基于模糊信息处理的图像分割方法研究[D];西安电子科技大学;1998年
【相似文献】
中国期刊全文数据库 前10条
1 黎明,张化光,何希勤;基于粗糙集的模糊模型辨识方法[J];东北大学学报(自然科学版);2000年05期
2 赵荣泳,张浩,李翠玲,樊留群,王骏;粗糙集连续属性离散化模型研究与应用要点分析[J];计算机工程与应用;2005年08期
3 李如强,陈进,伍星;一种基于粗糙集和模式识别的旋转机械故障诊断方法[J];机械科学与技术;2004年11期
4 桑雨;闫德勤;梁宏霞;李克秋;;对Chi2系列算法的改进方法[J];小型微型计算机系统;2009年03期
5 赵明清;;离散型决策表的二分归纳属性约简算法[J];山东科技大学学报(自然科学版);2009年01期
6 周创德;田卫东;;基于约束函数的差别矩阵及其求核算法[J];计算机工程;2008年15期
7 刘高峰;牟廉明;张涛;;基于改进区分矩阵的决策表增量式属性约简[J];计算机工程;2010年20期
8 朱红;基于Rough Set的最小决策算法的研究[J];计算机应用;2002年09期
9 王萍;粗糙集理论及其应用进展[J];南京工业职业技术学院学报;2004年03期
10 桂现才;;基于相对熵的一种属性约简算法[J];计算机工程与应用;2006年33期
中国重要会议论文全文数据库 前10条
1 王旭阳;王彤;李明;;基于粗糙集理论的分类规则挖掘方法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
2 聂力;王翰虎;;一个基于粗糙集理论的分类规则学习算法[A];第十六届全国数据库学术会议论文集[C];1999年
3 刘永红;薛青;郑长伟;;基于粗糙集理论的C4ISR评估方法[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
4 赵明清;陶树平;;基于模糊等价关系的粗糙集[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
5 葛丽;傅彦;;粗糙集在科学数据属性约简中的应用[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 肖健梅;芦晓明;王锡淮;;集装箱起重机防摇系统粗糙集控制[A];第二十六届中国控制会议论文集[C];2007年
7 李晓丽;王彤;杜振龙;;基于粗糙集理论的流数据最优特征选择[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
8 赵荣珍;杨娟;黄显华;;粗糙集理论的故障知识发现及其工程应用模式研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
9 李千目;戚湧;张宏;刘凤玉;;基于粗糙集神经网络的网络故障诊断新方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
10 叶明全;伍长荣;胡学钢;;一种集成粗糙集与Logistic回归的分类模型[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
中国重要报纸全文数据库 前10条
1 ;栉风沐雨铸辉煌 继往开来谱华章[N];人民邮电;2006年
2 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
3 本报记者 李智 通讯员 梁宪生;零的突破[N];山西经济日报;2001年
4 李磊;让电子政务更聪明[N];计算机世界;2001年
5 林伟贤;决策的智慧[N];中国邮政报;2006年
6 张连广;规范用权 从严治企[N];中国纪检监察报;2008年
7 赵莉;管理,功在于“细”[N];工人日报;2000年
8 马涛迅;洛阳纪委从制度入手加强自身监督[N];中国纪检监察报;2008年
9 本刊特约撰稿人 谢志华;对什么承担责任[N];中国财经报;2003年
10 邓昌平 邓泽东 谢显新;浦北江城镇:换位决策启示录[N];广西日报;2004年
中国博士学位论文全文数据库 前10条
1 丛蓉;作战指挥决策支持系统目标融合识别研究[D];大连理工大学;2010年
2 张国军;基于粗糙集的相对属性约简算法及决策方法研究[D];华中科技大学;2010年
3 马君华;粗糙集属性约简和聚类算法及其在电力自动化中的应用研究[D];华中科技大学;2010年
4 纪霞;不完备信息系统中粗糙集理论的扩展研究与应用[D];安徽大学;2010年
5 汪凌;基于粗糙集的不确定信息知识发现及在城市交通管理中的应用研究[D];西南交通大学;2011年
6 杨习贝;不完备信息系统中粗糙集理论研究[D];南京理工大学;2010年
7 崔广才;基于粗糙集的数据挖掘方法研究[D];吉林大学;2004年
8 赵佰亭;混合决策系统的粗集模型及在转台故障诊断中的应用[D];哈尔滨工业大学;2010年
9 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
10 孙英娟;基于粗糙集的分类方法研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
2 李慧;基于粗糙集理论的连续属性离散化算法研究[D];辽宁师范大学;2010年
3 雷明;基于粗糙集理论的决策表压缩[D];华北电力大学(北京);2010年
4 吕望;基于粗糙集的车辆超载自动检测方法研究[D];长沙理工大学;2010年
5 田静宜;基于粗糙集和神经网络的柴油机故障诊断研究[D];中北大学;2011年
6 李真;多值数据转换成单值定性符号的数学方法研究[D];燕山大学;2012年
7 于兴网;粗糙集属性约简算法在数据挖掘中的研究[D];重庆大学;2004年
8 魏悦亮;粗糙集在数据挖掘不确定性问题中的研究[D];中国石油大学;2010年
9 武金艳;粗糙集与证据理论在医疗智能诊断系统中的应用研究[D];湖南大学;2010年
10 穆海芳;基于粗糙集理论的故障诊断知识获取研究[D];合肥工业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026