收藏本站
收藏 | 论文排版

基于概念格模型的知识发现研究

谢志鹏  
【摘要】: 本文主要对基于概念格模型的知识发现进行研究,并对经典概念格模型进行了扩 展。研究工作的重点是使用概念格结构模型对关联规则、分类规则和函数依赖的发现 问题进行求解。此外,本文还对概念格的快速生成算法进行了深入的研究,提出了一 些高效的算法,文章的最后提出了几种概念格扩展模型,处理了数据中可能出现的缺 值和结构化属性值域的问题。 具体研究工作如下: 1)在已有算法的基础上,详细地分析了概念格的渐进式和批处理的构造过程,对 于渐进式构造和批处理构造,分别提出了一种较为高效的算法。本文的渐进式算法利 用一种树状结构来对概念格节点进行索引,从而有效地提高了概念格的构造速度。而 本文中批生成算法通过提出的扩展等价类这一概念来有效地减少了在每个节点处计算 其子节点的冗余计算量,从而达到提高算法效率的目的。实验结果表明,本文渐进式 算法的时间性能要明显优于著名的Godin算法。 2)在函数取值不变性(或近似不变性)的基础上,提出了概念节点的内涵缩减(或 近似内涵缩减)和内涵核(或近似内涵核)的概念,详细地研究了它们的性质,证明 了它们的计算问题都可以等价地转化为族集最小覆盖集的计算问题。而对于族集最小 覆盖集的计算问题,本文则提出了若干个定理刻画了其计算方法的原理并予以正确性 证明,并精心设计了相应的算法。 3)对于关联规则发现这一数据挖掘的核心任务,提出了一个基于概念格的关联规 则发现框架。首先,针对关联规则发现的需求,我们对概念格节点的结构进行了相应 的简化修改,并给出了相应的构造算法;然后基于内涵缩减,我们给出了从格上提取 关联规则的算法伪码,两个性质被用来去除冗余的关联规则;文中还分析了基于概念 格的关联规则发现与传统的发现算法相比所具有一系列的优点。然而,事务数据库有 时并不只是事务的简单集合,不同事物之间可能存在某种关系(如时序关系)。为了对 事务数据库中不同事务之间的时序关系进行处理,我们定义了间隔基准概念格作为对 经典概念格的一种扩展。从间隔基准概念格上可以提取出时序关联规则,这对于预测 是非常有用的。 4)为了借助于概念格模型来对未知的新对象进行分类,我们研制了两个分类系统 ——LACS系统和LACS-2系统。在LACS系统中,针对分类系统的特点,我们提出两 合肥工业大学博士学位论文 种重要而有效地剪枝策略来限制格构造过程中的节点生成,从而大大减少了所需生成 的格节点数目.在MONK数据集上的实验结果表明,LACS系统的分类精度要明显优 于其它一些著名的分类系统(例如 ID3、C4.5和 CNZ).在 LACS系统的基础上,我们 还研制了LACS-2系统,它为每个决策类建立一个概念格,然后使用所有生成的概念 格来共同对新对象进行分类.LACS-2系统中所使用的分类策略是相当灵活的,它可以 解决LACS系统中所不能解决的问题. 5)以无序偶作为基本元素,我们给出了区分系统和不可区分背景的形式化定义.区 分系统的缩减集计算统一了粗糙集合理论中信息系统的缩减集的计算问题和决策表的 相对缩减集的计算问题.而不可区分背景所对应的不可区分格则可以用于信息系统中 任意属性子集的缩减集计算,于是它可以用作一个框架结构来发现关系数据中所成立 的函数依赖关系. 6)提出了两种扩展的概念格模型.第一种扩展模型可以用于对形式背景中所出现 的缺值现象进行处理,这在本文中被称为粗糙形式概念格.我们还研究了从粗糙形式 概念格上提取规则的算法.当对象通过属性一值表示方法进行描述时,针对属性值域被 结构化为完全格或偏序集的情况,第二种扩展模型可以对其进行处理.文章的最后还 给出了这些扩展模型在序论和格论中的理论基础.


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 姜广;王俊红;梁吉业;;一种基于概念格的决策规则挖掘算法[J];电脑开发与应用;2006年07期
2 王娜;;基于概念格的知识获取[J];科技创业月刊;2010年06期
3 周燕艳;海深;;约简应用于概念格构造研究[J];铜陵学院学报;2006年02期
4 胡学钢;马冯;陈慧;;一种基于多概念格的分类规则融合方法[J];合肥工业大学学报(自然科学版);2006年09期
5 胡学钢,王媛媛;一种基于约简概念格的关联规则快速求解算法[J];计算机工程与应用;2005年22期
6 苏占东,游福成,杨炳儒;基于知识发现复杂不确定性系统预测模型研究应用[J];装备指挥技术学院学报;2005年03期
7 刘宗田;容差近似空间的广义概念格模型研究[J];计算机学报;2000年01期
8 苗茹;沈夏炯;;概念格中的规则提取[J];光盘技术;2006年01期
9 张倩生;周作领;许绍元;贾保果;罗俊;;基于广义概念格的广义粗近似空间中规则的发现与提取[J];计算机科学;2003年06期
10 苗茹;沈夏炯;;概念格经典算法对比[J];福建电脑;2007年03期
11 王旭;马垣;;基本概念格的关联规则挖掘算法[J];鞍山科技大学学报;2006年01期
12 王旭;马垣;;基于形式背景级联运算的关联规则挖掘算法[J];计算机应用与软件;2006年09期
13 姜传菊;;概念格在数字图书馆中的应用研究[J];情报科学;2010年12期
14 杨强;赵明清;;概念格研究进展[J];计算机工程与设计;2008年20期
15 杜秋香;张继福;张素兰;;基于概念提升的概念格更新构造算法[J];太原科技大学学报;2009年01期
16 毕强;滕广青;;国外形式概念分析与概念格理论应用研究的前沿进展及热点分析[J];现代图书情报技术;2010年11期
17 齐红;刘大有;胡成全;卢明;赵亮;;基于搜索空间划分的并行概念生成算法[J];计算机科学;2005年04期
18 姜瑾辉;谢福鼎;;基于概念格的图像语义检索研究[J];现代电子技术;2008年02期
19 赵奕,邢平平,施鹏飞,熊范纶;Rough有限格的蕴涵规则挖掘[J];上海交通大学学报;2001年02期
20 仇国芳;陈劲;;概念格的规则约简与属性特征[J];浙江大学学报(理学版);2007年02期
中国重要会议论文全文数据库 前10条
1 何超;程学旗;郭嘉丰;;基于层次概念格的分面导航[A];第六届全国信息检索学术会议论文集[C];2010年
2 曲立平;刘大昕;杨静;张万松;;基于属性的概念格快速渐进式构造算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
3 汤志钢;胡学钢;简宋全;;量化概念格研究[A];全国第十四届计算机科学及其在仪器仪表中的应用学术交流会论文集[C];2001年
4 赵传申;杨明;孙志挥;;基于概念格的分布多库规则发现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
5 申锦标;;一种新颖的概念格构造算法[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
6 赵奕;施鹏飞;;一种快速的概念格构造方法[A];中国体视学学会图像分析专业、中国体视学学会仿真与虚拟现实专业、中国航空学会信号与信息处理专业第一届联合学术会议论文集[C];2000年
7 马玉宝;胡学钢;;基于相关性分析构造概念格的研究[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
8 杨光飞;党延忠;;不完美数据中的知识发现研究综述[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
9 李勃;姚青;;一种基于概念格挖掘规则产生集的算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
10 董伯儒;林少培;王永文;;工程建设MIS中的知识发现和深化[A];中国土木工程学会计算机应用分会第七届年会论文集[C];1999年
中国博士学位论文全文数据库 前10条
1 谢志鹏;基于概念格模型的知识发现研究[D];合肥工业大学;2001年
2 滕广青;基于概念格的数字图书馆知识组织研究[D];吉林大学;2012年
3 智慧来;概念格构造与应用中的关键技术研究[D];上海大学;2010年
4 张云中;基于形式概念分析的Folksonomy知识发现研究[D];吉林大学;2012年
5 谢宗霞;太阳宁静区磁场流场特性知识发现的方法研究[D];哈尔滨工业大学;2010年
6 焦素云;基于概念格的动态策略存取模型[D];吉林大学;2011年
7 杨立;基于领域知识的知识发现研究[D];中国科学院研究生院(软件研究所);2005年
8 陈湘;基于基集和概念格的数据挖掘方法研究[D];电子科技大学;2011年
9 梁吉业;基于粗糙集与概念格的智能数据分析方法研究[D];中国科学院研究生院(计算技术研究所);2004年
10 秦昆;基于形式概念分析的图像数据挖掘研究[D];武汉大学;2004年
中国硕士学位论文全文数据库 前10条
1 梁泉;复杂系统预测中知识约简算法及其表示的研究[D];中南林学院;2004年
2 宛敏田;基于概念格的分类规则提取研究[D];合肥工业大学;2003年
3 王俊红;基于概念格的知识获取方法研究[D];山西大学;2004年
4 唐志军;基于分布式概念格的知识发现研究[D];合肥工业大学;2005年
5 王媛媛;基于概念格模型的关联规则挖掘算法研究及实现[D];合肥工业大学;2005年
6 卫祥;概念格的分布式构造方法研究与实现[D];合肥工业大学;2008年
7 张玉红;基于概念格扩展模型的分类问题研究[D];合肥工业大学;2004年
8 张晶;基于领域知识和概念格模型的知识发现研究[D];合肥工业大学;2004年
9 刘树鹏;基于概念格的本体合并方法与技术的研究[D];大连海事大学;2010年
10 王培培;基于区别度概念格的关联规则挖掘算法设计[D];河南大学;2010年
中国重要报纸全文数据库 前10条
1 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
2 中国科学院计算技术研究所 刘毅勇 何雄 李金山 廖浩均 孟亮 邓柱中;空间数据挖掘:变数据为知识[N];计算机世界;2005年
3 胡虎;突出信息化贡献水平 处理好三个关系[N];人民邮电;2007年
4 陈志楠;挖掘“不为人知的艺术”[N];科技日报;2009年
5 尤红梅;蔡雪晴:优势在于执行[N];中国企业报;2004年
6 汤天浩;人工智能技术:未来船舶系统的灵魂[N];中国船舶报;2005年
7 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
8 马炳厚;知识开发的创新成果[N];科技日报;2005年
9 本报记者  胡其峰;科技信息资源如何助力自主创新[N];光明日报;2006年
10 王广宇;如何游出“数据海洋”?[N];计算机世界;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978