概念格分布处理及其框架下的知识发现研究
【摘要】:概念格以其良好的数学性质已成功地应用于知识发现等诸多领域,但由于概念格自身的完备性,构造概念格的时间复杂度一直是影响形式概念分析应用的主要障碍。概念格应用的前提是概念格的构造。现在概念格的渐进式构造算法表现出了更强的生命力和适应性。但目前基本上都是属于基于对象的渐进式算法,而基于属性的构造算法未见报告。实际上,形式背景中数据的变化应该包括两个方面:一是对象的增减,二是属性的增减。增加属性可能使原来不能区分的对象能够区分,删除属性就可能使原来属于不同类的对象变为同一类。通过对概念格中概念之间的相互关系的了解,和对象和属性之间相互关系的研究,本文提出并实现了基于属性的概念格构造算法,特别是基于属性的渐进式生成算法。它不仅为概念格的生成提供了一种新的方法,而且解决了在已构造好概念格的前提下,增加属性所带来的概念格更新问题,另外,它也为分布式存储的形式背景的概念格横向合并提供了基础。
随着处理的形式背景的增大,构造概念格的时空复杂度也会随着急剧增大。研究采用新的方法和手段来构造概念格,就成为概念格研究的主要内容之一。现在已经提出的构造概念格的多种算法基本上是针对单个概念格的。采用分治策略来构造概念格是解决这一问题的有效途径。概念格的分布处理就是通过形式背景的拆分,形成分布存储的多个子背景,然后同时构造相应的子概念格,再由子概念格的合并得到所需的概念格。
由于概念格是其形式背景中的概念间关系的表现形式,它和对应的形式背景是一一对应的。因此,对概念格的分布处理必然涉及到形式背景的拆分、合并等处理。本文从形式背景的并置和叠置出发,定义了两种类型的形式背景和概念格;并对不一致背景的处理进行了研究;证明了横向合并的子形式背景的概念格和子背景所对应的子概念格的横向并是同构的;结合子概念格中概念间固有的泛化—特化关系,继承已有的概念格渐进式构造的算法,并对其进行改造,形成能满足多个子概念格合并处理要求的算法。
数据挖掘是自动从数据中提取出人们感兴趣的潜在的可用信息和知识,并将提取出来的信息和知识表示成概念、规则和模式。关联规则是发现知识的主要形式。提取关联规则的主要步骤是频繁项集的获取,而一个事务数据库中频繁项集的数量往往很庞大,从频繁项集中提取的规则就会很多,且存在大量的冗余。为了缩减频繁项集的数目同时也不丢失有用信息,现在采用用频繁封闭项集来提取最小无冗余的关联规则。
|
|
|
|
1 |
谢艳;马垣;张虹云;;一个快速建造概念格的算法[A];2001年中国智能自动化会议论文集(下册)[C];2001年 |
2 |
申锦标;;一种新颖的概念格构造算法[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年 |
3 |
杨思春;王建颖;陈家骏;;一种新的概念格属性约简算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年 |
4 |
赵传申;杨明;孙志挥;;基于概念格的分布多库规则发现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年 |
5 |
汤志钢;胡学钢;简宋全;;量化概念格研究[A];全国第十四届计算机科学及其在仪器仪表中的应用学术交流会论文集[C];2001年 |
6 |
何超;程学旗;郭嘉丰;;基于层次概念格的分面导航[A];第六届全国信息检索学术会议论文集[C];2010年 |
7 |
曲立平;刘大昕;杨静;张万松;;基于属性的概念格快速渐进式构造算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年 |
8 |
赵奕;施鹏飞;;一种快速的概念格构造方法[A];中国体视学学会图像分析专业、中国体视学学会仿真与虚拟现实专业、中国航空学会信号与信息处理专业第一届联合学术会议论文集[C];2000年 |
9 |
李勃;姚青;;一种基于概念格挖掘规则产生集的算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年 |
10 |
覃海生;韦海兰;李新华;;基于概念格的Web测试在廉租住房系统中的应用研究[A];广西计算机学会2010年学术年会论文集[C];2010年 |
|