基于扩展概念格的多数据源分类知识融合问题研究
【摘要】:数据挖掘领域里,分类问题一直以来都是的一个重要研究分支。在当前多数据源数据日益普及的情况下,对数据挖掘领域中分类问题的研究也提出了新的挑战,例如如何从多个数据源中提取出分类知识,并加以有效的融合。因此,研究一种有效的多数据源分类知识融合方法已成为当前数据库中知识发现的一个重要的研究方向。
概念格,是一种通过概念间的内涵和外延以及例化和泛化的关系来表示知识的模型。在概念格的内涵中引入等价关系,便可得到概念格的扩展模型,即扩展概念格,这种模型更加有利于分类知识的提取。本文的主要研究内容如下:
1.采用基于扩展概念格的方式,首先在每个数据源上建立对应的扩展概念格,然后从中提取出所需的分类知识,再加以有效的融合。文中涉及到了两种方式的知识表现形式:分类规则和分类子格,和与它们相对应的两种融合机制。对于这两种融合机制所得到的分类知识的完备性,都在文中给与了理论证明和实验验证。
2.对概念格扩展模型采用预剪枝的策略,来抑制过拟合现象的出现。概念格扩展模型具有较高的模型复杂度,一方面使其能够对训练数据集进行十分准确的分类,另一方面有会使得它很容易引起模型“过度拟合”现象的出现,从而影响到分类器在实际测试数据上的准确率;对此文中采用了对格进行预剪枝的方法,阻止格中部分不必要的分支的出现,从而降低模型的复杂度,避免模型过度拟合现象的出现。
3.在上述研究工作的基础上,实现了基于多扩展概念格的分类知识发现原型系统。
|
|
|
|
1 |
张春华,王阳;数据挖掘技术、应用及发展趋势[J];现代情报;2003年04期 |
2 |
鲁光男;;KDD在高校教育中的应用[J];长春大学学报;2008年12期 |
3 |
钱红;KDD在现代图书馆中的应用[J];农业图书情报学刊;2005年11期 |
4 |
王磊,王文云,王乔;基于软件构件技术的KDD算法的设计与实现[J];计算机工程与设计;2005年09期 |
5 |
魏先民;王玉玲;;粗集在KDD系统中的应用与研究[J];潍坊学院学报;2005年04期 |
6 |
杨江平;;知识发现及其在图书馆的应用研究[J];图书馆学研究;2008年07期 |
7 |
蓝海根;马峻;;关系型数据库中关联规则挖掘与实现技术[J];机械管理开发;2006年02期 |
8 |
吴云;;KDD技术及其应用[J];阴山学刊(自然科学版);2006年01期 |
9 |
张艳;;基于数量型数据挖掘的模糊概念关联规则[J];计算机时代;2009年10期 |
10 |
邹先霞,王淑礼,魏长华;数据仓库与数据挖掘技术浅谈[J];高等函授学报(自然科学版);2000年03期 |
11 |
陈岚岚,杨波,李旭霞;数据挖掘技术及其发展方向[J];武警工程学院学报;2002年04期 |
12 |
彭佳红;一种基于粗糙集的混合特征选择算法[J];计算机工程与科学;2005年11期 |
13 |
郭竑晖;;教育信息挖掘的探讨[J];电脑知识与技术(学术交流);2006年29期 |
14 |
赵丹群;数据挖掘:原理、方法及其应用[J];现代图书情报技术;2000年06期 |
15 |
郑宏珍,柳明欣;数据挖掘及其工具的选择[J];计算机应用;1999年S1期 |
16 |
赵海青,李社宗,周幸福,乔雨,申建毅;数据库中的知识发现及其在气象中的应用[J];河南气象;2002年02期 |
17 |
刘耀南;;浅析数据挖掘及其应用[J];电脑知识与技术;2010年33期 |
18 |
苏旸,王法能,张敏情;计算智能方法在KDD系统中的应用与研究[J];计算机工程与应用;2002年03期 |
19 |
张红军;谈谈数据挖掘技术及其应用[J];广西梧州师范高等专科学校学报;2003年03期 |
20 |
张小平,马垣;KDD中的数据清理技术研究[J];鞍山科技大学学报;2003年02期 |
|