收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于邻域粗糙集的属性约简算法研究

李楠  
【摘要】:计算机技术、网络和存储技术的快速发展,使得数据获取和存储变得越来越容易,从而加剧了海量数据集的产生。这些海量数据中往往包含有大量冗余的、不确定的和不完整的信息,严重影响人们从中获取有用的知识信息;而且随着数据的增减或改变,也会对核心数据产生影响。如何从这些含有冗余的、不确定的、不完整的并且不断变化的海量数据中发现有用的知识信息,以帮助人们做出正确的判断和决策,是数据挖掘的一个重要研究领域。 数据约简是在保持原有数据分类能力不变的前提下,将数据集中不重要的、不相关的冗余信息剔除掉。基于粗糙集理论的属性约简是近年来倍受研究者关注的数据约简研究之一。 粗糙集理论由波兰数学家Z.Pawlak教授于1982年提出。该理论基于集合论思想,是处理不确定和模糊数据的有力数学工具。经典粗糙集仅适用于处理符号型数据,不能有效处理连续型数据。邻域粗糙集实现了对连续和混合型数据的有效处理,避免了对数据进行离散化而可能发生的重要或隐含信息的丢失。因此,基于邻域粗糙集的属性约简算法就成为属性约简研究的新热点。 论文以邻域粗糙集为基础,研究了以下几种属性约简算法: 首先,对基于邻域粗糙集的属性约简算法进行改进,以邻域粗糙集所确定的正域来评价各个属性的重要性,按重要性从大到小依次将属性加入约简集合,形成了多个属性子集,以支持向量机的分类性能评价各属性子集,从而选出分类准确率最高的属性子集作为约简结果。提高了约简集合的分类预测准确性。仿真实验表明了该方法的可行性与有效性。 其次,针对连续型数据集不断更新变化的特点,提出了基于邻域粗糙集的属性约简增量式更新方法。根据新增样本对全集正域的影响,分情况对原约简集合进行不同的更新处理,有效避免了重复运算,降低算法复杂度。通过实例对算法进行了分析说明。 最后,针对不完整决策系统的约简算法具有较高时间复杂度问题,在原有约简算法基础上,提出了基于邻域粗糙集的不完整决策系统前向顺序属性约简算法。该算法不仅适用于符号型的不完整决策系统,也适用于不完整的实型和混合型数据集属性约简;在保持系统分类能力的情况下,降低了不完整决策系统属性约简算法的时间复杂度;并且选择出属性个数更少的属性子集;提高了不完整决策系统的属性约简效率。通过实验表明了该算法的可行性与有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈世清,唐志航,肖建华;基于粗糙集联系度的数据挖掘算法及应用研究[J];计算机应用;2004年06期
2 杨晓平,徐优红,许金权;考试成绩分析的粗糙集方法[J];浙江海洋学院学报(自然科学版);2002年04期
3 刘燕,张学庆,杨绍国;一种基于粗糙集分类的图像压缩方法[J];物探化探计算技术;2002年02期
4 蒋加伏,刁洪祥,唐贤瑛;一种基于粗糙集分类的图像增强方法[J];计算机工程与应用;2003年19期
5 冯志鹏,宋希庚,薛冬新;基于粗糙集与神经网络集成的内燃机故障诊断[J];内燃机学报;2003年01期
6 游凤荷,黄樟灿,孙砚飞,毛天祥;粗糙集的约简算法在涡流传感器设计中的应用[J];无损检测;2003年03期
7 石金彦,黄士涛,雷文平;粗糙集与决策树结合诊断故障的数据挖掘方法[J];郑州大学学报(工学版);2003年01期
8 魏彩乔,焦满囤;基于粗糙集的绿色度评价方法及实现技术[J];计算技术与自动化;2004年03期
9 王萍;粗糙集理论及其应用进展[J];南京工业职业技术学院学报;2004年03期
10 张连华,张冠华,张洁,白英彩;基于粗糙集分类的网络入侵检测[J];上海交通大学学报;2004年S1期
11 时希杰,沈睿芳,吴育华;基于粗糙集理论的研究生招生预测[J];微计算机应用;2005年01期
12 刘发升,杨炳儒;一种基于粗糙集的多层次、逐步求精的发掘算法[J];计算机工程与应用;1999年05期
13 王卫平,李熙亚,左远志;基于粗糙集的数控机床故障诊断最小化方法[J];组合机床与自动化加工技术;2001年02期
14 许中卫,李龙澍;基于粗糙集理论的数据挖掘算法研究[J];微机发展;2001年01期
15 邓方安,武多义;关于粗糙集的若干注记(Ⅰ)——粗糙集与Stone代数[J];汉中师范学院学报;2002年06期
16 郝丽娜,王伟,吴光宇,王宛山;粗糙集-神经网络故障诊断方法研究[J];东北大学学报(自然科学版);2003年03期
17 董广军,范永弘,罗睿;基于粗糙集理论的遥感影像分类研究[J];计算机工程与应用;2003年13期
18 宋余庆,罗永刚,孙志挥;应用主分量分析与粗糙集处理的特征提取[J];计算机工程与应用;2004年22期
19 刘发升,杨惠;一种带松弛因子的统计粗糙集挖掘算法[J];计算机应用;2004年08期
20 江效尧,胡林生;基于粗糙集的RDT决策树生成算法的研究及应用[J];安徽工程科技学院学报(自然科学版);2004年03期
中国重要会议论文全文数据库 前10条
1 肖健梅;芦晓明;王锡淮;;集装箱起重机防摇系统粗糙集控制[A];第二十六届中国控制会议论文集[C];2007年
2 李晓丽;王彤;杜振龙;;基于粗糙集理论的流数据最优特征选择[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
3 聂力;王翰虎;;一个基于粗糙集理论的分类规则学习算法[A];第十六届全国数据库学术会议论文集[C];1999年
4 王旭阳;王彤;李明;;基于粗糙集理论的分类规则挖掘方法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 刘永红;薛青;郑长伟;;基于粗糙集理论的C4ISR评估方法[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
6 赵明清;陶树平;;基于模糊等价关系的粗糙集[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
7 葛丽;傅彦;;粗糙集在科学数据属性约简中的应用[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
8 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
9 赵荣珍;杨娟;黄显华;;粗糙集理论的故障知识发现及其工程应用模式研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
10 顾成杰;张顺颐;刘凯;黄河;;基于粗糙集和禁忌搜索的特征选择方法[A];江苏省电子学会2010年学术年会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 张国军;基于粗糙集的相对属性约简算法及决策方法研究[D];华中科技大学;2010年
2 马君华;粗糙集属性约简和聚类算法及其在电力自动化中的应用研究[D];华中科技大学;2010年
3 杨习贝;不完备信息系统中粗糙集理论研究[D];南京理工大学;2010年
4 纪霞;不完备信息系统中粗糙集理论的扩展研究与应用[D];安徽大学;2010年
5 赵佰亭;混合决策系统的粗集模型及在转台故障诊断中的应用[D];哈尔滨工业大学;2010年
6 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
7 丛蓉;作战指挥决策支持系统目标融合识别研究[D];大连理工大学;2010年
8 哈斯巴干;神经网络及其组合算法的遥感数据分类研究[D];中国科学院研究生院(遥感应用研究所);2003年
9 张贤勇;基于精度与程度逻辑组合的几类粗糙集模型及其算法研究[D];四川师范大学;2011年
10 刘洪波;汉语认知脑数据挖掘相关算法及应用研究[D];大连理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 吕望;基于粗糙集的车辆超载自动检测方法研究[D];长沙理工大学;2010年
2 田静宜;基于粗糙集和神经网络的柴油机故障诊断研究[D];中北大学;2011年
3 于兴网;粗糙集属性约简算法在数据挖掘中的研究[D];重庆大学;2004年
4 雷明;基于粗糙集理论的决策表压缩[D];华北电力大学(北京);2010年
5 魏悦亮;粗糙集在数据挖掘不确定性问题中的研究[D];中国石油大学;2010年
6 袁晓娟;基于粒计算的双论域粗糙集模型研究[D];兰州大学;2010年
7 武金艳;粗糙集与证据理论在医疗智能诊断系统中的应用研究[D];湖南大学;2010年
8 穆海芳;基于粗糙集理论的故障诊断知识获取研究[D];合肥工业大学;2010年
9 李琴;基于粗糙集的商业智能决策的研究与应用[D];广东工业大学;2011年
10 张贤勇;粗糙集的数学基础研究与两个广义粗糙集模型的探讨[D];四川师范大学;2004年
中国重要报纸全文数据库 前6条
1 ;栉风沐雨铸辉煌 继往开来谱华章[N];人民邮电;2006年
2 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
3 本报记者 李智 通讯员 梁宪生;零的突破[N];山西经济日报;2001年
4 李磊;让电子政务更聪明[N];计算机世界;2001年
5 重庆邮电学院党委书记徐仲伟 院长 聂能;发挥学科优势 打造信息平台[N];科技日报;2005年
6 闫春龙 邱云龙;宣钢与北京工业大学共同申报发明专利[N];世界金属导报;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978