粗糙集属性约简算法在数据挖掘中的研究
【摘要】:随着数据库的不断增长,自动从数据库中获取有用的知识成为人们日益迫切的需要。粗糙集理论(Rougll Sets)就是在这样背景下不断发展起来的一种用于不精确、不确定数据挖掘与处理的新型数学理论。粗糙集理论也凭借其独特的优势而在KDD领域中具有越来越重要的地位。
属性约简是粗糙集理论研究的核心问题之一,本文首先介绍了Pawlak粗糙集模型以及决策表、可辨识矩阵和约简等基本概念,为后面章节中的属性约简算法打下了理论基础。
现已证明,寻找一个决策表的最小约简是NP-难问题,在人工智能中,解决这类问题的方法一般是使用启发式算法。
本文把属性重要性作为启发式信息,以核属性为寻求约简的起点,通过对算法中加入启发式信息,减少了搜索空间。给出了相对可辨识矩阵的概念,并以相对可辨识矩阵为基础,对属性约简的基本算法做出了改进,把本来是对可辨识矩阵进行逻辑运算的计算转化成代数运算,在一定程度上简化了计算,提高了约简效率。后面又提到了基于信息熵的相对属性约简算法。并在文章的最后提出了一种新的基于灰色关联度的属性约简算法,实验证明,该算法可以获得令人满意的约简。
|
|
|
|
1 |
李智玲;张亦军;胡彧;;基于粗糙集的遗传算法在数据挖掘中的应用[J];科技情报开发与经济;2009年09期 |
2 |
石金彦,黄士涛,雷文平;粗糙集与决策树结合诊断故障的数据挖掘方法[J];郑州大学学报(工学版);2003年01期 |
3 |
许中卫,李龙澍;基于粗糙集理论的数据挖掘算法研究[J];微机发展;2001年01期 |
4 |
范娟;王红艳;;知识发现中的数据离散化处理[J];保定师范专科学校学报;2006年02期 |
5 |
谭耀武;;基于数据挖掘粗糙集技术的电信运营商客户价值评价[J];沿海企业与科技;2006年01期 |
6 |
胡启韬;袁志平;周忠海;;基于粗糙集和遗传算法的数据挖掘方法[J];电脑知识与技术;2008年11期 |
7 |
黄海云;;图书馆数据挖掘服务系统中粗糙集算法的原理及应用[J];河北工业科技;2010年05期 |
8 |
胡启韬;袁志平;周忠海;;基于粗糙集和遗传算法的数据挖掘方法[J];江西蓝天学院学报;2008年S1期 |
9 |
刘云枫;柯林;;一种改进的基于粗糙集的数据挖掘方法研究[J];情报杂志;2008年05期 |
10 |
汪小燕;;粗集结合决策树在高校图书馆中的应用[J];电脑学习;2008年05期 |
11 |
赵广社,张希仁;数据挖掘中的统计方法概述[J];计算机测量与控制;2003年12期 |
12 |
柳炳祥;邓欢军;高淑妍;陈欢欢;;基于数据挖掘的图书馆个性化服务系统[J];现代情报;2007年03期 |
13 |
唐少先;;数据挖掘中粗糙集边界的处理方法[J];计算机工程与应用;2010年07期 |
14 |
李永敏,朱善君,陈湘晖,张岱崎,韩曾晋;基于粗糙集理论的数据挖掘模型[J];清华大学学报(自然科学版);1999年01期 |
15 |
刘同明,曾富贵,刘伟;数据融合与数据挖掘相集成的自动目标识别系统[J];计算机工程与应用;2002年03期 |
16 |
孙涛;董立岩;李军;张羽翔;;用于粗糙集约简的并行算法[J];吉林大学学报(理学版);2006年02期 |
17 |
丁春荣;李龙澍;;一个基于粗集的决策树规则提取算法[J];计算机技术与发展;2007年11期 |
18 |
刘科;;基于KNN算法的文本分类[J];科技经济市场;2009年06期 |
19 |
张华;魏文军;;粗糙集和决策树方法在微机监测中的应用研究[J];科技信息;2011年13期 |
20 |
白秀玲;王平;普杰信;;一种粗糙集值约简算法及其应用[J];微计算机信息;2006年33期 |
|