基于粗糙集理论的快速属性约简算法研究
【摘要】:属性约简是粗糙集理论中的重要研究内容之一,它是基于粗糙集理论的规则获取与决策支持的基础。属性约简的结果与速度直接决定了规则的质量,进而影响到决策的效果。然而,到目前为止属性约简的速度仍然是制约粗糙集理论发展及实际应用的瓶颈之一。因此,研究快速的属性约简算法具有重要理论意义与应用价值。
本文对基于粗糙集理论的属性约简算法进行了系统深入的研究,并在此基础上提出了基于粗糙集理论的三种快速属性约简算法,主要研究内容如下:
(1)深入分析了已有的差别矩阵,发现基于现有差别矩阵的属性约简算法只能得到代数观下决策表的属性核和属性约简。提出了一种信息观下的差别矩阵,并基于该矩阵设计了一种信息观下决策表的属性约简算法。该算法通过计算信息观下差别矩阵中各属性出现的频率确定属性的重要度,进而根据各个属性的重要度来计算决策表的约简。实验结果表明该算法与基于Hu差别矩阵的属性约简算法和基于杨明的差别矩阵属性约简算法相比,可以求出信息观下属性约简,且比基于Hu差别矩阵的算法计算约简得耗时更短。
(2)给出了从决策表中去除论域后Shannon熵的变化机制,并以此为基础提出了一种快速决策表属性约简算法。该算法以信息观下决策表的属性核为起点,不断将属性重要度大的属性添加到核属性集中,在此过程中逐步把决策表中协调的部分从论域中去除,把不协调的部分作为新的论域,这样可以减少参与属性约简计算的对象数。因此,该算法可以在一定程度上降低求取属性约简的计算量。实验结果表明提出的算法求得的属性约简与CEBARKCC算法求得的属性约简相同,约简消耗的时间却明显少于CEBARKCC算法。
(3)提出了从混合决策表中去除协调部分,Shannon条件熵的变化机制,并以此为理论基础,提出一种快速的混合数据属性约简算法。该算法可以逐步减少参与属性约简的对象个数,进而提高约简算法的效率。实验结果表明该算法的与胡清华提出的混合数据约简算法相比,获得的属性约简完全相同,而算法的消耗的时间相对更少。
这些研究成果将基于粗糙集理论的数据挖掘与知识发现提供新的有效的处理技术。
|
|
|
|
1 |
赵明清;;离散型决策表的二分归纳属性约简算法[J];山东科技大学学报(自然科学版);2009年01期 |
2 |
李天志;;基于二进制的决策表求核算法[J];电脑开发与应用;2008年03期 |
3 |
康胜武,曾一锋,王华火,王应明;一种基于粗糙集的单一属性分类的约简方法[J];厦门大学学报(自然科学版);2001年04期 |
4 |
陶志;刘庆拯;李卫民;;一种基于改进区分矩阵的属性约简算法[J];计算机工程与应用;2007年32期 |
5 |
邓少波;关素洁;黎敏;刘清;;属性与属性值合一的数据约简算法[J];模式识别与人工智能;2009年02期 |
6 |
李伟涛;刘琼荪;;基于系统熵的粗糙集属性约简新方法[J];微型机与应用;2011年09期 |
7 |
桂现才;;基于相对熵的一种属性约简算法[J];计算机工程与应用;2006年33期 |
8 |
唐洪浪;;基于决策强度的一种属性约简算法[J];湛江师范学院学报;2007年06期 |
9 |
张群峰,王静红,李笔;基于属性约简的决策表算法[J];河北省科学院学报;2005年03期 |
10 |
李波,李新军;一种基于粗糙集和支持向量机的混合分类算法[J];计算机应用;2004年03期 |
11 |
张信宾,李钝;利用粗糙集和概率统计进行客户关系管理[J];电脑开发与应用;2004年10期 |
12 |
杨宝华;李绍稳;樊建峰;;红籽瓜数量性状的粗糙集判别方法[J];农业网络信息;2006年06期 |
13 |
官礼和;王国胤;;决策表属性约简集的增量式更新算法[J];计算机科学与探索;2010年05期 |
14 |
梁福才;林成龙;;粗糙集属性约简的完备算法[J];电光与控制;2007年02期 |
15 |
高黎;沙基昌;余滨;卜先锦;;属性约简中的近似问题研究[J];系统工程理论与实践;2007年02期 |
16 |
马昕;林丽清;;蚁群算法在面向属性的数据约简中的应用[J];计算机仿真;2007年09期 |
17 |
李秀燕;刘自伟;;基于差别矩阵属性约简算法的改进[J];兵工自动化;2007年09期 |
18 |
高婷;刘文奇;;一种基于布尔矩阵的新的属性约简完备算法[J];计算机工程与科学;2009年08期 |
19 |
李伟涛;刘琼荪;;粗糙集属性约简的一种新算法[J];电脑知识与技术;2010年35期 |
20 |
唐彬,李龙澍,李伟,刘政怡,杨增光;一类对Jenolek属性约简算法的新的改进方法[J];系统仿真学报;2005年05期 |
|