收藏本站
《广西师范大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于粗糙集的属性约简和求核的算法研究

舒文豪  
【摘要】:粗糙集理论是一种分析模糊、不精确和不确定信息的数学工具。其主要特点是它不需要任何先验的知识,或任何其它附加的信息,便可直接对海量数据进行处理加工,从中发现所隐含的知识,即决策规则。目前,粗糙集理论已经在数据挖掘,知识发现、智能决策、过程控制、人工智能和专家系统等领域得到了较为广泛的应用。 属性约简和求核是粗糙集理论及应用的重要研究内容之一。属性约简是指在保持知识库中数据分类能力不变的情况下,删除知识库中不相关或冗余的属性,使得知识库中的知识表示可以简化,而且又不丢失知识库中的基本重要信息。如果能将知识库中的冗余属性删除,这样可有效缩小知识库的处理规模,从而提高潜在知识在知识库中的清晰度。但由于在对决策表进行属性约简时,大多数约简算法都是首先以核为基础,然后在核的基础上利用启发信息求解属性约简。为此,如何设计出高效的属性约简和求核算法具有重要的研究意义。 目前,很多学者提出了多种属性约简的算法,绝大多数都是以完备决策表作为研究对象。然而在实际应用中由于数据的测量误差、对知识获取的限制等各种原因,人们往往面对的是不完备决策表,即决策表可能存在某些属性的属性值是未知的。如今基于不完备决策表的属性约简和求核算法已成为粗糙集理论中的热点研究内容之一。但由于目前不完备决策表的属性约简算法的时间复杂度相对较高,这样使得算法不利于处理大规模数据,所以如何设计出不完备决策表的快速属性约简算法具有广泛的实际意义。 本文首先简要阐述有关粗糙集理论的基础理论知识,并系统地概述了目前基于完备决策表和基于不完备决策表的属性约简和求核的常见模型及其相关算法,然后在学习和借鉴已有研究成果的基础上,做出如下主要的创新点内容: 1)根据简化决策表中的对象关于属性值是有序的及核是简化差别矩阵中差别元素个数为1这两个性质,利用基数排序的思想,设计了一种高效的基于正区域的求核算法,其时间复杂度为O(│C│2│U/C)+O(│C‖U│),其空间复杂度为O(|U|)。在该算法中,可将具有核属性的差别元素集映射到一个较小的搜索空间上,只需判断简化差别矩阵中的少量差别元素就可找到核属性集,这样算法的效率得到了改善。并通过实例分析表明了新算法的高效性。 2)给出一个Skowron简化差别矩阵的核定义,并分析证明了该定义与和基于Skowron差别矩阵的核定义是相等的。为求解Skowron简化差别矩阵,引入了一个快速求简化决策表的算法。然后提出了一种新的可有效提高计算核属性算法的性质,在此基础上设计了基于Skowron差别矩阵的高效求核算法,算法的时间复杂度为O(│C‖U│)+O(│C│2U/C│),并通过实验结果显示了新算法的效率优于典型的两种算法。 3)为了尽可能地减少差别矩阵的存储空间,而又能同时利用差别矩阵的设计思想,结合区分对象对的方法,设计了一个新的基于信息熵的属性约简算法,该算法无需去计算差别矩阵,但同时又利用了差别矩阵的思想。为了有效降低算法的复杂度,在简化决策表的基础上,给出了区分对象对集的属性约简的定义,并从理论上证明了该定义与基于信息熵的属性约简的定义等价。在此基础上设计了基于区分对象对集的信息熵属性约简算法,其时间复杂度和空间复杂度分别为:O(│C‖U│)+O(│C‖U/C│2),和O(|U/C|2)+O(|U|)。 4)在不完备决策表中,利用容差类的性质将计算容差TC(x)的算法时间复杂度降为O(K│U‖C│),同时给出了一个基于正区域模型下的差别矩阵及相应的属性约简定义,证明了该定义与基于正区域的属性约简的定义是等价的。然后将不完备决策表下的基于正区域的属性约简建立在该差别矩阵上,且由于该差别矩阵无需比较Uneg之间的对象,使得差别矩阵得以简化。在此基础上,设计了基于正区域的属性约简算法,时间复杂度为max{O│C│2│Upas‖U│),O(K│U‖C│)。最后通过具体的实例说明了算法的有效性。 5)在不完备决策表中,给出了一个基于广义决策模型下的差别矩阵及相应的属性约简的定义,证明分析了该定义与广义决策的属性约简的定义是等价的。并将差别矩阵进行了有效地压缩,去掉了大量无用的空值元素,使得差别矩阵中只保留对算法有用的元素,从而节省大量的存贮空间,提高算法的效率。然后利用相应的差别矩阵设计了基于广义决策的属性约简算法,将时间复杂度降至O(|C|2|U|2),最后通过具体的实例来说明算法的有效性。
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP301.6;TP18

【相似文献】
中国期刊全文数据库 前10条
1 王萍;粗糙集理论及其应用进展[J];南京工业职业技术学院学报;2004年03期
2 康胜武,曾一锋,王华火,王应明;一种基于粗糙集的单一属性分类的约简方法[J];厦门大学学报(自然科学版);2001年04期
3 高黎;沙基昌;余滨;卜先锦;;属性约简中的近似问题研究[J];系统工程理论与实践;2007年02期
4 马昕;林丽清;;蚁群算法在面向属性的数据约简中的应用[J];计算机仿真;2007年09期
5 李伟涛;刘琼荪;;粗糙集属性约简的一种新算法[J];电脑知识与技术;2010年35期
6 李伟涛;刘琼荪;;基于系统熵的粗糙集属性约简新方法[J];微型机与应用;2011年09期
7 陈丽雯,陈燕,任宏旺;基于粗糙集的属性约简算法改进[J];微机发展;2003年12期
8 李波,李新军;一种基于粗糙集和支持向量机的混合分类算法[J];计算机应用;2004年03期
9 张杰,廖桂生,王珏;一种基于roug hset的多用户检测算法[J];系统工程与电子技术;2004年04期
10 闫德勤;;基于等价类矩阵的属性约简[J];计算机科学;2005年11期
中国重要会议论文全文数据库 前10条
1 齐晓轩;纪建伟;韩晓微;原忠虎;;基于FCM的粗糙集属性约简方法在汽轮机故障诊断中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
2 华勇;张云龙;;粗糙集理论在模式识别中的应用[A];2011年亚太青年通信学术会议论文集(2)[C];2011年
3 叶明全;伍长荣;胡学钢;;一种集成粗糙集与Logistic回归的分类模型[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
4 刘永红;薛青;郑长伟;;基于粗糙集理论的C4ISR评估方法[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
5 杜跃;张旭;王鑫;;基于支持度_置信度框架的粗糙集值约简算法及其应用[A];2011国际信息技术与应用论坛论文集(《计算机科学》2011.7)[C];2011年
6 徐怡;李龙澍;李学俊;;扩充的基于集对联系度的粗糙集模型[A];第二十六届中国控制会议论文集[C];2007年
7 肖健梅;芦晓明;王锡淮;;集装箱起重机防摇系统粗糙集控制[A];第二十六届中国控制会议论文集[C];2007年
8 顾成杰;张顺颐;刘凯;黄河;;基于粗糙集和禁忌搜索的特征选择方法[A];江苏省电子学会2010年学术年会论文集[C];2010年
9 张云龙;华勇;;基于粗糙集理论的软件质量评价方法[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
10 李菊;王军;王兴;;基于改进的二进制辨识矩阵的属性约简算法[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
中国重要报纸全文数据库 前6条
1 ;栉风沐雨铸辉煌 继往开来谱华章[N];人民邮电;2006年
2 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
3 本报记者 李智 通讯员 梁宪生;零的突破[N];山西经济日报;2001年
4 李磊;让电子政务更聪明[N];计算机世界;2001年
5 重庆邮电学院党委书记徐仲伟 院长 聂能;发挥学科优势 打造信息平台[N];科技日报;2005年
6 闫春龙 邱云龙;宣钢与北京工业大学共同申报发明专利[N];世界金属导报;2011年
中国博士学位论文全文数据库 前10条
1 马君华;粗糙集属性约简和聚类算法及其在电力自动化中的应用研究[D];华中科技大学;2010年
2 张国军;基于粗糙集的相对属性约简算法及决策方法研究[D];华中科技大学;2010年
3 丛蓉;作战指挥决策支持系统目标融合识别研究[D];大连理工大学;2010年
4 赵佰亭;混合决策系统的粗集模型及在转台故障诊断中的应用[D];哈尔滨工业大学;2010年
5 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
6 纪霞;不完备信息系统中粗糙集理论的扩展研究与应用[D];安徽大学;2010年
7 贾修一;基于语义的粗糙集理论和模型研究[D];南京大学;2011年
8 杨习贝;不完备信息系统中粗糙集理论研究[D];南京理工大学;2010年
9 骆公志;粗糙集理论及其在高等教育评估中的应用研究[D];南京航空航天大学;2009年
10 滕书华;基于粗糙集理论的不确定性度量和属性约简方法研究[D];国防科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨常清;基于粗糙集的属性约简算法研究[D];西安电子科技大学;2010年
2 李楠;基于邻域粗糙集的属性约简算法研究[D];陕西师范大学;2011年
3 王鹏;基于邻域粗糙集的属性约简算法研究[D];河北科技大学;2011年
4 梁蒙;基于粗糙集的属性约简算法研究[D];河南大学;2011年
5 陈展雄;基于多种群免疫量子粒子群的粗糙集属性约简与故障诊断[D];华东理工大学;2011年
6 任宏旺;基于粗糙集的数据挖掘模型的研究与应用[D];大连海事大学;2003年
7 王明娜;一种改进的粗糙集方法在数据挖掘中的应用[D];长春理工大学;2004年
8 葛丽;粗糙集在海量科学数据挖掘中的应用[D];电子科技大学;2005年
9 高婷;基于粗糙集的属性约简算法研究[D];昆明理工大学;2008年
10 唐彬;基于粗集理论的知识发现研究[D];安徽大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026