面向混合不完备决策信息系统的粗糙集模型及约简算法研究
【摘要】:随着科技的迅速发展和自动化程度的提高,许多领域都出现规模庞大且又复杂的信息系统,这些信息系统不但含有连续型数据也含有离散型数据,简称为包含混合数据的信息系统。该信息系统如果使用经典的粗糙集理论的等价关系对其进行相关操作,则首先需要对其中的连续型数据进行离散化,然后再对其属性进行简化,但是这样会造成一些有价值信息的丢失和约简结果的不正确。为了解决上面的问题,Lin利用邻域关系代替传统的等价关系,提出了邻域粗糙集的概念。邻域粗糙集可以定义某个对象的邻域,更多地考虑对象之间的关联性,而不用进行离散化处理,克服了经典粗糙集理论只能处理离散型数据的局限性。基于Lin所提出的邻域粗糙集理论和信息系统中存在值缺失的情况,赵佰亭提出了邻域容差关系的定义及相关性质。此关系能够很好的对具有缺失值的信息系统进行处理,但是它只考虑了对象之间的完全相似和不相似这两种情况,所以也会影响对象的分类。黄恒秋在分析上述问题的基础上,提出了邻域联系度容差关系。此关系可以人为地控制信息粒度的粗细,具有伸缩性的优势,但是它只考虑到同一度和差异度对对象分类的影响,没有考虑到对立度对对象分类的影响,不能很好地处理含有噪声数据的混合不完备信息系统。所以本文进一步的对其进行研究,研究成果如下:(1)本文基于对传统的粗糙集模型和邻域知识的分析,为了克服邻域联系度容差关系没有考虑到对立度对对象之间分类的影响的缺点,引入了对立度阂值,全面考虑了影响对象分类的因素:同一度、差异度、对立度,提出了改进的邻域联系度容差关系,并使用此关系来确定对象之间的划分类。(2)为了克服传统的粗糙集模型对对象进行分类时只考虑完全包含和不包含这两种情况的缺点,本文在改进的邻域联系度容差关系的基础上,引入错误分类率β来扩展包含关系,于是就提出了基于改进的邻域联系度容差关系的变精度粗糙集模型。该模型允许一定范围内的错误分类率的存在,即对对象进行分类时可以是某种程度上的包含关系,并定义了该模型的上、下近似的概念以及对该模型的相关性质进行介绍。最后通过实例证实了本文所提出的基于改进的邻域联系度容差关系的变精度粗糙集模型的有效性和其具有相对高的分类精度的优势。(3)针对改进的邻域联系度容差关系下混合不完备决策信息系统的属性约简问题,我们对传统的二进制分辨矩阵进行分析。由于存在决策不一致性问题以及传统的二进制分辨矩阵删除法效率较低且得不到最小约简结果,本文提出了改进的属性约简方法。最后通过实例和仿真实验证实了改进的属性约简方法具有约简效率高和能得到相对较小的约简结果的优势。