基于粗糙集的几类广义信息系统知识发现与决策方法研究
【摘要】:随着信息科学技术的不断发展,特别是现代网络技术和计算机存储技术的飞跃式进步,数据的获取变得越来越容易,导致数据规模呈爆炸式增长态势,与此同时数据的结构也变得更加复杂,经典的信息系统已经不足以对大规模的复杂数据进行刻画,为此针对不同类型的数据提出了一系列广义信息系统。如何快速对这些大规模复杂数据进行挖掘,并作出相应的决策分析在理论研究和实际应用中都有突出的意义。粗糙集理论作为一种由数据驱动的智能计算工具,可以在不具备先验知识的情况下对各种类型的数据进行挖掘,特别是在对不确定性数据的知识发现与决策分析过程中有着明显的优势。本文以粗糙集理论为基础,分别就知识发现和决策分析对区间值序信息系统、多粒度信息系统和混合值信息系统进行研究,论文的主要研究成果和创新如下:(1)针对区间值序信息系统中属性集变化时快速更新近似集的问题,分别对删除属性和增加属性两种情况下动态更新近似集的方法进行讨论,得到了属性集变化时动态更新近似集的一般准则,并结合更新机制设计了近似集动态更新算法。然后,基于几个UCI数据集对算法的有效性进行验证分析,实验结果表明动态算法与一般的近似集计算方式相比在计算效率方面有着明显的优势。(2)针对多粒度信息系统中的双量化决策分析问题,通过在多粒度框架下对决策粗糙集和程度粗糙集的近似算子进行重新组合,建立了三对双量化多粒度决策粗糙集模型,并深入研究了模型的一些基本性质,然后讨论了双量化多粒度决策粗糙集模型与其他粗糙集模型的关系。最后,结合一个医疗诊断案例对模型在决策分析中的应用进行了展示。(3)针对混合值决策信息系统中的决策粗糙集建模问题,建立了三种不同广义混合距离度量方式,然后结合高斯核函数构造了基于邻域的粒化机制,并对粒化过程中的参数设置规则进行了讨论。紧接着,结合Bayesian决策方法在混合值决策信息系统中建立了决策粗糙集模型,并通过一个实际案例演示了混合值决策信息系统中的决策分析过程。(4)针对混合值决策信息系统中的属性约简问题,分别基于相对正域和最小决策代价研究了混合值决策信息系统的属性约简规则,然后结合约简规则设计了对应的启发式属性约简算法。进一步,基于UCI数据集采取不同的距离度量方式和约简算法去获取约简,并分别就约简长度和错误分类代价对不同的约简获取方式进行比较分析。本文基于粗糙集理论对几类广义信息系统的知识发现与决策分析方法进行了研究,得到了区间值序信息系统中属性集变化时动态更新近似集的方法,在多粒度信息系统建立了六个双量化多粒度粗糙集模型,提出了混合值决策信息系统中决策粗糙集模型并设计了两种启发式属性约简算法。这些成果在一定程度上拓展和丰富了粗糙集理论在广义信息系统中的应用,为动态数据环境下的知识发现和复杂数据的决策分析提供了理论指导和技术支持。
|
|
|
|
1 |
本报记者 李智 通讯员 梁宪生;零的突破[N];山西经济日报;2001年 |
2 |
重庆邮电学院党委书记徐仲伟 院长 聂能;发挥学科优势 打造信息平台[N];科技日报;2005年 |
|