收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于粗糙集理论的不确定性度量和属性约简方法研究

滕书华  
【摘要】:随着数据获取手段的快速发展,数据库数量和规模的增长速度远远超出了人类分析和应用的能力。如何从杂乱无章的、强干扰的海量数据中挖掘出潜在的、新颖的、正确的、有利用价值的知识,来改变“数据丰富,知识贫乏”这种局面,已成为智能信息处理领域研究的一个重要课题。 粗糙集理论作为一种新的知识发现方法,在很多领域获得了广泛的应用,其中属性约简是其最重要的应用之一。经过近30年的发展,基于粗糙集的属性约简理论和方法得到了迅速的发展和完善,但也存在着一些问题。如,不确定性度量在属性约简中有着重要的应用,而现有度量方法并不能精确描述集合的不确定性,故探讨更加合理的度量方法是一个基础性问题;此外,缺乏普遍适用的高效约简算法,这是制约粗糙集理论实用化的重要方面。据此,本文对粗糙集理论的不确定性度量和属性约简两方面进行了系统研究,主要工作及创新如下: (1)从知识区分能力角度在一般二元关系下提出了多种知识不确定性度量,通过直观的文氏图表示给出了新的不确定性度量明确的粗糙集理论含义,从而使得粗糙集理论中的不确定性度量的本质易于理解,丰富了粗糙集理论的内涵,并为后续的属性约简算法打下了理论基础。 (2)考虑到数据对象具有不同重要性的情况,基于一般二元关系提出了新的知识加权不确定性度量—α熵、α条件熵和α互信息。通过调整参数α分析了现有多种不确定性度量的异同,进而将现有的多种不确定性度量统一在一般二元关系的粗糙集模型中。新的加权不确定性度量方便地融入了主观偏好、先验知识等因素,从而更加符合实际。 (3)在一般二元关系下提出了一种适用性更广、更加有效的加权集成不确定性度量。理论分析和实例表明新的集成不确定性度量弥补了现有不确定性度量的缺陷,更符合人类的认知规律,更精确的反映了粗糙集的两种不确定性。 (4)为了提高算法效率,把属性的区分能力作为启发函数,首先利用不可区分度在一般信息系统中提出了一种能够处理噪声的、高效的完备约简算法;其次,在决策信息系统中利用相对可区分度提出了一种高效的启发式约简算法,并给出了该算法与代数观点和信息观点下约简算法间的关系。通过对仿真数据和UCI数据集的实验结果表明,两种基于区分能力观点的约简算法不仅能有效的处理海量数据,而且在大多数情况下能够得到紧凑约简。 (5)针对不协调决策系统,首先讨论了基于区分能力观点的约简定义和现有的不协调决策表多种约简定义之间的关系,给出了多种简化协调决策表的概念,进而提出了一种基于区分能力观点的高效不协调决策表约简算法。实验结果表明,新算法不仅可以求得现有多种方法的属性约简,而且具有较好的约简质量和较高约简效率,适合处理具有大量冗余属性的不协调数据集。 (6)考虑到决策信息系统中的噪声,在一般二元关系下提出了两种能够抑制噪声的近似属性约简算法,即AAR-DV算法和AAR-WαA算法,两种算法适用于多种粗糙集扩展模型,摆脱了现有约简算法对特定二元关系的依赖。特别是AAR-WαA算法还将数据的先验知识引入到了约简算法中。实验表明两种近似约简算法可有效增强抗噪性,在有效降低约简属性集规模的同时,还提高了约简结果的分类性能。 (7)考虑到进行分类时组合多个约简将产生互补信息,在一般二元关系下提出了一种基于加权α精度的多约简组合分类算法。通过对UCI数据的实验表明,多约简组合分类算法对于存在大量约简的数据集是可行的,在不增加算法时间复杂度基础上,不仅有效降低了特征数量,还大大提高了分类精度。 综上所述,本文提出的不确定性度量和高效属性约简算法具有明确的粗糙集理论含义,简单易于理解,适用范围广,具有重要的理论意义和潜在的应用价值。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张信宾,李钝;利用粗糙集和概率统计进行客户关系管理[J];电脑开发与应用;2004年10期
2 康胜武,曾一锋,王华火,王应明;一种基于粗糙集的单一属性分类的约简方法[J];厦门大学学报(自然科学版);2001年04期
3 高黎;沙基昌;余滨;卜先锦;;属性约简中的近似问题研究[J];系统工程理论与实践;2007年02期
4 马昕;林丽清;;蚁群算法在面向属性的数据约简中的应用[J];计算机仿真;2007年09期
5 李伟涛;刘琼荪;;粗糙集属性约简的一种新算法[J];电脑知识与技术;2010年35期
6 陈丽雯,陈燕,任宏旺;基于粗糙集的属性约简算法改进[J];微机发展;2003年12期
7 李波,李新军;一种基于粗糙集和支持向量机的混合分类算法[J];计算机应用;2004年03期
8 张杰,廖桂生,王珏;一种基于roug hset的多用户检测算法[J];系统工程与电子技术;2004年04期
9 李伟涛;刘琼荪;;基于系统熵的粗糙集属性约简新方法[J];微型机与应用;2011年09期
10 闫德勤;;基于等价类矩阵的属性约简[J];计算机科学;2005年11期
11 杨宝华;李绍稳;樊建峰;;红籽瓜数量性状的粗糙集判别方法[J];农业网络信息;2006年06期
12 邵明文;龙卫江;;合成信息系统与予信息系统的属性特征[J];计算机工程;2007年17期
13 张群峰,王静红,李笔;基于属性约简的决策表算法[J];河北省科学院学报;2005年03期
14 李秀燕;刘自伟;;基于差别矩阵属性约简算法的改进[J];兵工自动化;2007年09期
15 宁伟;张坤;;粗糙集属性约简贪心算法的改进[J];泰山学院学报;2008年03期
16 高婷;刘文奇;;一种基于布尔矩阵的新的属性约简完备算法[J];计算机工程与科学;2009年08期
17 刘锋;柳炳祥;;一种自适应遗传算法在粗糙集属性约简中的应用[J];软件导刊;2009年09期
18 闫德勤;李克秋;迟忠先;;信息系统属性约简的柔性差别矩阵[J];通信学报;2009年08期
19 官礼和;王国胤;;决策表属性约简集的增量式更新算法[J];计算机科学与探索;2010年05期
20 肖厚国;;基于免疫遗传算法的粗糙集属性约简[J];科技信息;2010年30期
中国重要会议论文全文数据库 前10条
1 葛丽;傅彦;;粗糙集在科学数据属性约简中的应用[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 刘永红;薛青;郑长伟;;基于粗糙集理论的C4ISR评估方法[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
3 肖健梅;芦晓明;王锡淮;;集装箱起重机防摇系统粗糙集控制[A];第二十六届中国控制会议论文集[C];2007年
4 李晓丽;王彤;杜振龙;;基于粗糙集理论的流数据最优特征选择[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 陈昭炯;叶东毅;;粗糙集在一类林业数据决策分析中的应用[A];中国运筹学会第六届学术交流会论文集(下卷)[C];2000年
6 聂力;王翰虎;;一个基于粗糙集理论的分类规则学习算法[A];第十六届全国数据库学术会议论文集[C];1999年
7 王旭阳;王彤;李明;;基于粗糙集理论的分类规则挖掘方法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
8 齐晓轩;纪建伟;韩晓微;原忠虎;;基于FCM的粗糙集属性约简方法在汽轮机故障诊断中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
9 赵明清;陶树平;;基于模糊等价关系的粗糙集[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
10 叶明全;伍长荣;胡学钢;;一种集成粗糙集与Logistic回归的分类模型[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
中国博士学位论文全文数据库 前10条
1 张国军;基于粗糙集的相对属性约简算法及决策方法研究[D];华中科技大学;2010年
2 马君华;粗糙集属性约简和聚类算法及其在电力自动化中的应用研究[D];华中科技大学;2010年
3 丛蓉;作战指挥决策支持系统目标融合识别研究[D];大连理工大学;2010年
4 滕书华;基于粗糙集理论的不确定性度量和属性约简方法研究[D];国防科学技术大学;2010年
5 纪霞;不完备信息系统中粗糙集理论的扩展研究与应用[D];安徽大学;2010年
6 赵佰亭;混合决策系统的粗集模型及在转台故障诊断中的应用[D];哈尔滨工业大学;2010年
7 杨习贝;不完备信息系统中粗糙集理论研究[D];南京理工大学;2010年
8 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
9 阎瑞霞;粗糙集的论域扩展理论及在专家系统中的应用[D];东华大学;2012年
10 贾修一;基于语义的粗糙集理论和模型研究[D];南京大学;2011年
中国硕士学位论文全文数据库 前10条
1 李楠;基于邻域粗糙集的属性约简算法研究[D];陕西师范大学;2011年
2 王鹏;基于邻域粗糙集的属性约简算法研究[D];河北科技大学;2011年
3 梁蒙;基于粗糙集的属性约简算法研究[D];河南大学;2011年
4 任宏旺;基于粗糙集的数据挖掘模型的研究与应用[D];大连海事大学;2003年
5 陈展雄;基于多种群免疫量子粒子群的粗糙集属性约简与故障诊断[D];华东理工大学;2011年
6 宋家瑸;基于邻域粗糙集的信号指纹属性约简[D];北京邮电大学;2011年
7 袁晓娟;基于粒计算的双论域粗糙集模型研究[D];兰州大学;2010年
8 王明娜;一种改进的粗糙集方法在数据挖掘中的应用[D];长春理工大学;2004年
9 魏悦亮;粗糙集在数据挖掘不确定性问题中的研究[D];中国石油大学;2010年
10 李琴;基于粗糙集的商业智能决策的研究与应用[D];广东工业大学;2011年
中国重要报纸全文数据库 前6条
1 ;栉风沐雨铸辉煌 继往开来谱华章[N];人民邮电;2006年
2 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
3 本报记者 李智 通讯员 梁宪生;零的突破[N];山西经济日报;2001年
4 李磊;让电子政务更聪明[N];计算机世界;2001年
5 重庆邮电学院党委书记徐仲伟 院长 聂能;发挥学科优势 打造信息平台[N];科技日报;2005年
6 闫春龙 邱云龙;宣钢与北京工业大学共同申报发明专利[N];世界金属导报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978