收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

粗集与它的若干特性研究

李健  
【摘要】: 1982年,Z.PaMak教授提出了粗集理论,它是一种新的处理模糊和不确定性知识的数学工具,其主要思想是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则.粗集理论与概率方法、模糊集方法和证据理论等其他处理不确定性问题的理论的最显著区别是它无需提供问题所需处理的数据集合之外的任何先验知识.由于该理论未能包含处理不精确或不确定原始数据的机制,所以与其他处理不确定性问题的理论有很强的互补性.粗集理论在数据挖掘、知识发现、模式识别、决策分析等诸多领域取得了广泛的应用.2002年史开泉教授将Z.Pawlak粗集进一步推广,提出了奇异粗集(singular rough sets),简称S-粗集,它有三种形式:单向S-粗集,单向S-粗集对偶和双向S-粗集.S-粗集将Z.Pawlak粗集的静态形式扩展成粗集的动态形式,使粗集具有了更为广泛的应用.2005年史开泉教授再次提出函数S-粗集,它是建立在函数论域基础上的.由于函数与规律等价,因此函数S-粗集可以广泛地应用于规律挖掘,规律识别等. 本文的主要研究内容是:给出了粗集粗相似度的公理化定义;提出了粗模糊集中粗相似度和粗贴近度的概念,及其在模糊模式的粗识别方面的应用;提出了集合的条件熵的定义,并用以刻画粗集的不确定性;给出了基于粗糙熵的不协调信息系统中的知识约简方法;提出一种变精度粗模糊集的形式:θ-粗模糊集;最后对S-粗集的动态结构进行了研究,讨论了单元素迁移与S-粗集结构的关系. 第一章绪论,首先叙述了Z.Pawlak粗集理论的提出背景、发展和研究近况,给出了Z.Pawlak粗集的定义和性质;其次给出了理论上的扩展S-粗集和函数S-粗集的定义. 第二章给出粗集粗相似度的公理化定义,设U的幂集F(U)上的二元函数S:F(U)×F(U)→[0,1],(X,Y)(?)S(X,Y),若S满足下列条件:(1)S(X,Y)=S(Y,X);(2)S(X,Y)=1(?)X≈R Y;(3)RX∩RY=φ(?)S(X,Y)=0;(4)X(?)Y(?)Z(?)S(X,Z)≤{S(X,Y)∧S(Y,Z)},则称S(X,Y)是X与Y的相似度.并根据上粗相似度和下粗相似度,给出几种常用的粗相似度形式,证明了几种粗相似度形式都满足公理化定义,讨论了它们的具体性质.粗集的粗相似度是精确集相似度的推广. 在第三章中,将粗相似度的定义推广到粗模糊集中(模糊集和粗集都用来解决不确定性问题,所以D.Dubois和H.Prade将两者结合,提出了粗模糊集的概念并给出了粗模糊集的一般形式),提出了粗模糊集中粗相似度A,B_R的定义,即A,B_R=(?),给出了它的基本性质,得到了定理3.2.10和定理3.2.11,它们分别是A,B_R=0的充要条件是对任意的x∈U,都有(?)_R(x)=0或(?)_R(x)=0和A,B_R=1的充要条件是对任意的x∈U,都有(?)_R(x)=(?)_R(x)且(?)_R(x)=(?)_R(x). 在模糊集理论中,常用贴近度刻画不同模糊集间的相似程度,本章通过定义均值模糊集和粗隶属度的概念,将贴近度引入到粗模糊集中,称之为粗贴近度.定义了粗模糊集的Hamming粗贴近度、Euclid粗贴近度、最小-最大粗贴近度和最小平均粗贴近度,给出了它们的具体性质,得到了定理3.3.8和定理3.3.9.还给出了粗相似度与最小-最大粗贴近度的关系定理,即定理3.3.10.粗相似度和粗贴近度都可用来度量粗模糊集之间的相似程度,其中粗相似度侧重于局部(利用上、下近似求得),粗贴近度侧重于整体(利用粗隶属度求得). 在一个模糊系统中,可以用不同模糊集之间的粗相似度量建立粗聚类模型和粗识别模型,基于本章介绍的这两种新度量,可以对近似空间中现有的粗模糊集进行聚类,然后根据聚类结果,利用最大相似度原理,对新的模糊样本进行粗识别,来判断它属于哪个模式.文中应用一个简单的例子解释了这种粗模式识别模型. 第四章关于粗集的不确定性度量进行了研究.首先描述了知识的粗糙性,介绍了知识的粗糙熵概念,以及信息系统中知识与粗糙熵之间的关系.针对目标信息系统,介绍了知识的条件粗糙熵的概念,并在此基础上提出了一种新的刻画粗集不确定性的度量——集合的条件粗糙熵,简称条件熵,给出集合条件熵的具体性质和相关定理.在近似空间中,等价类划分越细时,知识的粒度越小,知识的不确定性就越小.定理4.5.4说明集合的条件熵也具有此性质,所以用其刻画粗集的粗糙性是合理的,而且,通过一个例子说明用条件熵刻画粗集不确定性比粗集的粗糙度要好.定理4.5.10说明在同一个近似空间中,将集合X和Y合并后,它们的粗糙熵即不确定性会变小,由此可应用于目标信息系统(决策系统)中,每一个决策集都可看作是一个粗集,将不同决策集合并会使得决策集的不确定性变小. 另外,在目标信息系统(U,A∪D,f)中,目标属性集D在U上导出的划分为U/IND(D)={D_1,D_2,…,D_m),知识D相对于知识B的条件粗糙熵为H(D/B),那么有日(D/B):(?)H_B(D_j)成立,这就是定理4.6.2,它揭示了知识的条件粗糙熵与本章定义的集合的条件熵之间的本质联系.对于目标信息系统(U,A∩D,f),D的条件粗糙熵反映了信息系统整体的不确定程度,条件属性集A导出的划分越细,不确定程度越小;而每个决策集D_j(j=1.2.….m)的条件熵反映的是信息系统局部的不确定程度,条件属性集A导出的划分越细,每个目标属性子集D_j的不确定程度都会变小,从而解释了整体的不确定程度会变小这一事实. 第五章研究了信息系统中的知识约简问题,讨论了基于粗糙熵的知识约简方法.首先介绍了无目标信息系统的知识约简方法,然后重点研究了目标信息系统的知识约简问题.由于协调目标信息系统可看作是不协调信息系统的特殊情况,不协调信息系统的知识约简方法同样适用于协调的信息系统,所以本章只讨论了不协调信息系统中的知识约简问题.提出了目标信息系统中,目标集的粗糙熵、对象的粗糙熵等几种新概念,然后研究了这几种新概念和不协调信息系统中各种知识约简的等价关系,由定理5.3.8给出.在不协调信息系统(U,A∪D,f)中,B(?)A是分布协调集的充要条件是对任意的u_i∈U,H_B(D/u_i)=H_A(D/u_i);B(?)A是分布协调集的充要条件是对任意的D_j,1≤j≤m,有H_B(D_j)=H_A(D_j);B(?)A是分配协调集(上近似协调集)的充要条件是(?)|{j:H_B(D_j/u_i)0}1=(?)|{j:H_A(D_j/u_i)0}|或(?)|{i:H_B(D_j/u_i)0}|=(?)|{i:H_A(D_j/u_i)0}|;B(?)A是下近似协调集的充要条件是|{k:H_B(D/u_k)=0}|=|{k:H_A(D/u_k)=0}|.进而提出了一种新的处理不协调信息系统知识约简的方法,基本步骤是先找出属性集的核,然后向核中添加重要性大的属性,最后可以得到不协调信息系统的分布约简、上近似约简(分配约简)和下近似约简.通过一个实例验证了该方法的有效性. 第六章讨论了变精度粗模糊集的内容.给出一种新的变精度粗模糊集的概念:θ-粗模糊集,其中θ是误差参数,0θ≤1.定理6.2.7说明随着精度θ的减小,粗模糊集的正域和负域将扩大,边界域将缩小,从而近似精度增大,粗糙度减小.特别地,若θ=1,则(?)~θ和(?)~θ分别退化为粗模糊集意义下的(?)和(?),而(?)_α~θ和(?)_β~θ分别退化为(?)_α和(?)_β.这说明θ-粗模糊集是粗模糊集在变精度意义下的推广.定理6.2.9是粗模糊集A依参数0β≤α≤1的θ-下近似(?)_α~g和θ-上近似(?)_β~θ分别等于A的α-截集的θ-下近似和A的β-截集的θ-上近似.特别地,当A是经典集时,对于任意的α,β∈(0,1],(?)_α和(?)_β分别退化为A在Pawlak意义下的下近似(?)(A)和上近似(?)(A);而(?)_α~θ和(?)_β~θ分别退化为A在变精度模型下的θ-下近似(?)_θ(A)和θ-上近似(?)_θ(A).这说明,θ-粗模糊集是变精度粗集在模糊意义下的推广.最后用一个例子验证了本章的结果. 第七章讨论了S-粗集中的单元素迁移,以及由单元素迁移引起的S-粗集结构的变化特征.定理7.2.2指出,对于集合X(?)U,元素u迁入X使得(?)X增大,(?)X不变的充要条件是:[u](?)Bn(X),[u]-u(?)X;u迁入X使得(?)X不变,(?)X增大的充要条件是:[u](?)Neg(X),card([u])≥2;u迁入X使得(?)X与(?)X都增大的充要条件是:[u](?)Neg(X),card([u])=1;u迁入X使得(?)X与(?)X都不变的充要条件是:[u](?)Bn(X),([u]-u)∩X≠φ.类似地,定理7.3.2讨论了单元素迁出的情况. 双向S-粗集的动态结构特征: X~f={u|u∈U,u(?)X,f(u)=x∈X)是X的f-扩张,X~(?)={x|x∈X,(?)(x)=u(?)X)是X的(?)-萎缩.设X~f={u_1,u_2,…,u_p),X~(?)={u_1,u_2,…,u_q},根据X~*=X∪X~f-X~(?),我们可以把X~*看作是由X先扩张后萎缩而得到的,X经过p次单元素迁入扩张成为X~°,X~°经过q次单元素迁出萎缩成为X~*.每一次单元素迁移都会对粗集结构产生影响,具体情况可以根据定理7.2.2和定理7.3.2来判定.在集合扩张和萎缩的实际过程中,迁移的顺序可能是杂乱无章的,但这并不影响分析结果. 本文的创新点: 创新点1.给出粗集粗相似度的公理化定义,结合上粗相似度和下粗相似度给出了几种新的满足公理化定义的粗相似度形式.将粗相似度和模糊集中的贴近度概念拓展到粗模糊集中,给出了粗模糊集的粗相似度和粗贴近度的定义,研究了它们的具体性质,以及基于这两种度量的模糊模式的粗聚类和粗识别的简单算法. 创新点1列于第二章和第三章中. 创新点2.在条件粗糙熵理论的基础上,提出了集合的条件粗糙熵(简称为条件熵)的定义,并用粗集的条件熵来刻画其不确定性.将集合条件熵的定义应用到了目标信息系统(决策系统)中.对于目标信息系统而言,每个决策集的条件熵反映了系统局部的粗糙程度,所有决策集条件熵的和反映了目标信息系统整体的不确定程度. 创新点2列于第四章中. 创新点3.提出了目标信息系统中目标集的粗糙熵、对象的粗糙熵等几种新概念,研究了这几种新概念和不协调信息系统中各种知识约简(分布约简、上近似约简、分配约简和下近似约简)的等价关系,在此基础上给出了不协调信息系统中进行知识约简的方法. 创新点3列于第五章中. 创新点4.给出一种新的变精度粗模糊集的概念:θ-粗模糊集,给出θ-粗模糊集的性质定理. 创新点4列于第六章中. 创新点5.研究了S-粗集中的单元素迁移,以及引起的S-粗集结构的变化情况,用单元素迁移解释了双向S-粗集的动态结构特征. 创新点5列于第七章中.


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 史开泉,崔玉泉;变异S-粗集与它的变异结构[J];山东大学学报(理学版);2004年05期
2 周勇,毛宇光,王建东;中介粗集及其在数据挖掘中的应用[J];南京航空航天大学学报;2000年06期
3 钱振伟,高怀雁,罗艳琳;基于粗集知识推理的IDSS中的知识表示[J];云南大学学报(自然科学版);2003年01期
4 黎永锦;弱粗数[J];中山大学学报(自然科学版);2003年05期
5 祝峰;粗集理论的现状与前景[J];新疆石油学院学报;2000年03期
6 张玉林,仲伟俊,常松;指数预测的一种混合模型[J];系统工程理论方法应用;2002年02期
7 于剑,程乾生;粗集与不可测集[J];科学通报;2000年07期
8 赵卫东,李旗号;粗集在数据开采中的应用[J];系统工程学报;2002年04期
9 胡寿松,徐德友,刘亚;基于粗集模型的歼击机损伤故障检测[J];控制理论与应用;2003年06期
10 祝峰,王加佳,严向奎;粗集理论的现状与前景[J];新疆大学学报(自然科学版);2000年04期
11 赵卫东,曹文彬,戴伟辉;不完全信息下的粗集拓展[J];系统工程学报;2002年06期
12 周宏,周小燕,赵卫东;粗集不可分辨关系的拓展及其可视化研究[J];系统工程理论方法应用;2002年01期
13 崔玉泉,史开泉;利用马氏链来分析粗集的动态变动[J];山东大学学报(理学版);2003年02期
14 赵书军,梅燕,王蓉;一种基于粗集理论的BP神经网络加速算法[J];四川师范大学学报(自然科学版);2002年05期
15 马锐;生成等价关系的性质[J];云南师范大学学报(自然科学版);2004年05期
16 谭光兴,潘健;基于粗集和BP网络的区域产品绿色度评价[J];广西工学院学报;2002年01期
17 曹秀英,梁静国;基于粗集理论的属性权重确定方法[J];中国管理科学;2002年05期
18 田文英,宫可想,张恒杰;不完全信息处理方法[J];石家庄职业技术学院学报;2004年02期
19 夏佳荣;;粗集近似精度及其粒度特征[J];杭州师范学院学报(自然科学版);2007年05期
20 唐勇敏;;基于粗集的神经网络的项目风险评估[J];商场现代化;2008年29期
中国重要会议论文全文数据库 前10条
1 凌方;王建东;;基于可变精度粗集的规则简化方法[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 刘保仓;刘若慧;;粗模糊集的嵌入集的性质[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
3 王洪德;马云东;;基于粗集-BP网络的通风系统可靠性预警方法研究[A];中国科协2004年学术年会第16分会场论文集[C];2004年
4 王慧敏;佟金萍;;宏观经济预警新探索:粗集—神经网络预警方法[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年
5 胡学钢;郭骏;王浩;袁兆山;;基于粗集与基于格结构的知识发现方法比较[A];全国第十四届计算机科学及其在仪器仪表中的应用学术交流会论文集[C];2001年
6 许翔;张东波;王耀南;刘子文;;一种新型的基于模糊划分的粗集神经网络[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
7 王名扬;于达仁;卫金茂;;变精度粗集模型在电厂故障诊断中的应用[A];2004电站自动化信息化学术技术交流会议论文集[C];2004年
8 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
9 程玉胜;张佑生;胡学钢;;一种Gray区域表征的关键条件属性集逆向求解[A];'2006系统仿真技术及其应用学术交流会论文集[C];2006年
10 郭海涛;王连玉;刘颉;梁捷;;基于粗集理论的声呐图像增强[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 曹秀英;基于粗集的数据挖掘技术及其应用研究[D];哈尔滨工程大学;2003年
2 胡咏梅;基于粗集的车间动态调度研究[D];山东大学;2005年
3 刘盾;基于粗糙集理论的多属性决策方法[D];西南交通大学;2011年
4 韩斌;基于数据挖掘的信息融合理论和应用[D];浙江大学;2002年
5 陈清才;基于粗集的汉语建模及其应用研究[D];哈尔滨工业大学;2003年
6 李秋丹;数据挖掘相关算法的研究与平台实现[D];大连理工大学;2004年
7 于冬;面向数字城市的复杂性研究[D];天津大学;2004年
8 赵家黎;基于SOV理论的过程质量控制方法研究[D];天津大学;2007年
9 关洪军;石化行业经营风险控制模型构建与应用研究[D];武汉理工大学;2012年
10 徐德友;粗集信息分析在故障诊断中的应用及自修复飞行控制系统效能评估[D];南京航空航天大学;2002年
中国硕士学位论文全文数据库 前10条
1 汤义强;结合粗集的数据分析方法及应用研究[D];安徽大学;2011年
2 李保平;基于S-粗集的系统规律挖掘与非线性系统输出反馈[D];安徽大学;2011年
3 牟宗瀛;粗集选股模型及随机择机模型初探[D];北京工业大学;2001年
4 宋雪飞;基于粗集理论值约简的数据挖掘系统[D];长春理工大学;2002年
5 杜军;基于粗集—神经网络的宏观经济预警研究[D];河海大学;2003年
6 徐昕;基于粗集和神经网络的建模方法及其应用[D];南京工业大学;2003年
7 刘春亚;基于粗集理论的数据预处理及应用研究[D];重庆大学;2003年
8 程玉胜;粗集理论约简及其应用的研究[D];合肥工业大学;2003年
9 闵小宝;基于证据推理模型的K-NN分类[D];江西师范大学;2002年
10 杨宝华;基于粗集的数据挖掘算法研究及应用[D];合肥工业大学;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978