粗糙集理论中若干问题的研究及应用
【摘要】:
随着互联网和信息系统的迅猛发展和广泛应用,人们可以轻易地获得海量的数据,并且这些数据还在日益不断地增长中,对这样的数据仍然采用传统的人工处理方法变得不切实际,于是希望计算机能够自动地帮助我们处理这些海量的数据,并提取出隐含的有价值的知识,辅助管理和决策,这就需要研究者对机器学习,特别是数据库知识发现作更加深入和广泛的研究。
粗糙集理论是进行数据挖掘的一项重要工具。因为粗糙集理论能够处理不完备不准确的数据并且其提取出的规则易于理解,同时,自粗糙集于八十年代提出之后,其已成功地运用于许多商业应用中,因而粗糙集理论得到了众多研究者的青睐。对粗糙集理论作深入的研究,将有利于更加有效地从海量数据中提取出有价值且可理解性强的知识,也有利于数据挖掘在商业中的进一步普及和应用。
本文提出了利用差别矩阵求解核的改进算法,提高了核计算的运算效率。因为差别矩阵是粗糙集理论应用的重要基础之一,对差别矩阵的改进将有利于提高数据挖掘的整体效率。本文还对结合扩张矩阵理论和粗糙集理论进行数据挖掘的方法作了进一步的探讨,指出了各自优缺点的根源所在,有利于充分利用两者的优势,同时尽量消除两者在处理数据中的不足,获得更为理想的数据挖掘算法。另外,本文对动态数据挖掘方法进行了讨论,指出了其无法处理特殊信息模式的不足,并在凡事皆有例外的哲学指导下提出了一个基于粗糙集理论的新知识模式的数据挖掘算法。以上提及的算法在我们的数据库知识发现软件系统knowlegeInside中都得到了实现。
|
|
|
|
1 |
本报记者 李智 通讯员 梁宪生;零的突破[N];山西经济日报;2001年 |
2 |
王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年 |
|