收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于分类模型的知识发现机理和方法研究

蒙祖强  
【摘要】:知识发现(KDD,Knowledge Discovery in Databases)是从数据中获取知识的一种智能信息处理技术。本论文在深入分析国内外相关研究成果的基础上,首先利用粒度计算理论,独立于具体算法,展开对基于分类模型的知识发现机理的研究,以探讨信息系统中知识形成的一般性规律和内在机制,并由此分析KDD研究中若干问题及其存在的根源。然后,在充分研究多种面向KDD的计算方法的基础上,提出新的理论和方法,对个性化知识发现、效率和准确率问题以及KDD算法的早熟收敛等问题展开了研究,形成一套有效的解决方法,拓展了传统的知识发现方法。本文的主要工作及创新性成果如下: 提出并构造信息系统的知识粒度空间——超粒度空间(S_GS)和全粒度空间(AllGS),找到了定义于超粒度空间之上的格和布尔代数。利用格的性质,得到了全粒度空间.的结构模型——超树,其节点代表全粒度空间中的粒度。布尔代数、格和超树及其有关性质,进一步丰富和完善了KDD的几何和代数理论体系,初步形成了信息系统知识空间的数学模型和拓扑结构。在现有决策逻辑语言的基础上,定义用于粒度描述的正基语言,提出并研究“全粒度空间+正基语言”的粒度计算模型,找到了正基语言系统、全粒度空间和基本概念空间的关系,证明了这种关系是正基语言系统到全粒度空间的一个满射。进而分析了知识的形成机理和个性化知识发现问题存在的根源,把知识发现归结为,在全粒度空间(或超树)中搜索各目标概念的最佳粒度表示并形成其有效描述的过程。显然,该过程是基于提出的模型,而粒度空间、超树、格和布尔代数等的有关性质由此而得到完美的结合并在搜索过程中发挥重要的启发作用。同时,分析了一些KDD算法存在早熟收敛、局部知识产生的原因等,提出本文解决方法的基本思路。 基于RS理论提出完备的个性化属性约简算法——DA-FPR算法。该算法的特点是,首先构造分辨矩阵的极小全空间以及基于空间的Θ_简化运算和x_子化运算;然后在用户偏好的作用下,通过交替用运这两种运算(交替次数不超过条件属性集的大小),逐步去除用户不感兴趣的条件属性,最终使得极小全空间收敛于单目空间;最后可由单目空间直接得到所需的约简。实验表明,极小全空间的规模与训练集规模几乎无正比关系,算法时间开销主要是用于构建极小全空间;而之后的操作基本上是基于条件属性集合的简单运算,其时间开销与前面相比,是非常小的,所以算法具有较高的效率;并在与已有方法对比的基础上证实了算法的有效性。文中还从理论上证明了DA-FPR算法的有效性、收敛性和完备性。 提出规则约简算法——DA-FPDR算法和决策算法极小化算法——PA-MRS算法。前者对每一条规则去除其中用户不感兴趣的属性-值对,后者则进一步去掉用户不感兴趣的整条规则。这


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 韩惠琴,刘柏嵩,董其军;知识发现在数字图书馆中的应用[J];大学图书馆学报;2001年01期
2 张春华,李迪,陈生隘;焊接车间管理中融合知识发现的探讨和实践[J];现代制造工程;2001年12期
3 范洪冬,高奋生;土地数据库中的数据挖掘[J];农业网络信息;2005年11期
4 王志宏;;数据库中的知识发现概述[J];商场现代化;2006年24期
5 戴泳;;知识发现与知识挖掘技术及其应用[J];科技情报开发与经济;2007年26期
6 张龙;肖琬蓉;王博;;数据挖掘技术及其应用[J];甘肃科技;2007年11期
7 邱晓辉;;知识发现与数据挖掘分析[J];情报探索;2011年01期
8 楼伟进,孔繁胜;软件组件技术与知识发现系统[J];微型电脑应用;1999年12期
9 应飚,楼伟进;软件组件技术与知识发现系统[J];计算机工程与设计;2000年06期
10 冀俊忠,沙志强,刘椿年,郎青;B2C电子商务站点中知识发现的研究[J];北京工业大学学报;2003年02期
11 叶飞跃;;远程教学系统与数据挖掘[J];阴山学刊(自然科学版);2003年02期
12 彭景芹,刘振明,赵可新;人工智能技术在配电自动化中的应用[J];微计算机信息;2005年08期
13 谢永红,阿兹古丽.吾拉木,杨炳儒;一个通用型知识发现系统中数据预处理的实现[J];计算机应用研究;2005年11期
14 刘多兰;隐性知识的发现与利用[J];情报杂志;2005年10期
15 石军;数据挖掘在高校图书馆的应用[J];江西图书馆学刊;2005年03期
16 谢含;;数据挖掘在中医药文献研究中的应用[J];中医药信息;2005年06期
17 谢含;谢漫;;数据挖掘——未来图书馆参考咨询工作的新方法[J];高校图书馆工作;2006年01期
18 朱红蕾;徐志刚;李明;刘密霞;;概念格的知识发现研究[J];微计算机信息;2006年06期
19 张丽;;数据仓库与数据挖掘[J];贵州民族学院学报(哲学社会科学版);2006年02期
20 胡中栋;张杰;;数据挖掘在美容美体中心的应用[J];电脑开发与应用;2007年04期
中国重要会议论文全文数据库 前10条
1 杨光飞;党延忠;;不完美数据中的知识发现研究综述[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
2 董伯儒;林少培;王永文;;工程建设MIS中的知识发现和深化[A];中国土木工程学会计算机应用分会第七届年会论文集[C];1999年
3 张世海;刘晓燕;涂庆;欧进萍;王光远;;知识发现及其在高层结构智能选型中应用[A];计算机技术在工程建设中的应用——第十二届全国工程建设计算机应用学术会议论文集[C];2004年
4 万家华;刘冰;江早;;知识发现中的可视化技术[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 赵荣珍;杨娟;黄显华;;粗糙集理论的故障知识发现及其工程应用模式研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
6 董伯儒;林少培;王永文;;工程建设MIS中的知识发现和深化[A];中国土木工程学会计算机应用分会第七届年会土木工程计算机应用文集[C];1999年
7 段培俊;周东岱;;数据挖掘研究综述[A];2003年中国智能自动化会议论文集(下册)[C];2003年
8 张文修;徐萍;米据生;吴伟志;;知识系统与知识发现[A];中国系统工程学会模糊数学与模糊系统委员会第十一届年会论文选集[C];2002年
9 阮鸣梁;陈维默;;数据挖掘技术的发展与应用[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
10 杜培军;方涛;林卉;;遥感影像库中数据挖掘与知识发现的研究[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
中国博士学位论文全文数据库 前10条
1 谢宗霞;太阳宁静区磁场流场特性知识发现的方法研究[D];哈尔滨工业大学;2010年
2 张云中;基于形式概念分析的Folksonomy知识发现研究[D];吉林大学;2012年
3 杨立;基于领域知识的知识发现研究[D];中国科学院研究生院(软件研究所);2005年
4 陈元;基于分类模型的知识发现过程研究[D];国防科学技术大学;2002年
5 李初民;基于网络管理数据库中性能数据的知识发现(KDD)研究[D];重庆大学;2001年
6 李刚;知识发现的图模型方法[D];中国科学院软件研究所;2001年
7 谢志鹏;基于概念格模型的知识发现研究[D];合肥工业大学;2001年
8 吴涛;构造性知识发现方法研究[D];安徽大学;2003年
9 刘刚;数据挖掘技术与分类算法研究[D];中国人民解放军信息工程大学;2004年
10 汤永川;关于不确定性推理理论与知识发现的研究[D];西南交通大学;2002年
中国硕士学位论文全文数据库 前10条
1 薛静;专家信息管理系统在CRM中的研究与应用——基于java技术的构架[D];西北工业大学;2001年
2 陈红叶;Web信息提取及知识发现方法研究[D];合肥工业大学;2002年
3 迟庆云;基于决策树的分类算法研究和应用[D];山东师范大学;2005年
4 王益玲;基于DCS实时信息的智能故障诊断系统的研究与设计[D];南京工业大学;2003年
5 李长源;关联规则挖掘算法研究[D];哈尔滨工程大学;2005年
6 郭国印;数据挖掘技术的研究及其在PLM中的应用[D];西北工业大学;2005年
7 谷宏群;数据挖掘中可视化方法研究[D];武汉大学;2005年
8 梁利莉;数据挖掘技术在CRM中的应用研究[D];首都经济贸易大学;2005年
9 刘娟;中药药对的量化分析与知识发现[D];成都中医药大学;2005年
10 黄律;基于粗糙集的多分类器组合及其在知识发现中的应用研究[D];长沙理工大学;2005年
中国重要报纸全文数据库 前10条
1 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
2 中国科学院计算技术研究所 刘毅勇 何雄 李金山 廖浩均 孟亮 邓柱中;空间数据挖掘:变数据为知识[N];计算机世界;2005年
3 胡虎;突出信息化贡献水平 处理好三个关系[N];人民邮电;2007年
4 陈志楠;挖掘“不为人知的艺术”[N];科技日报;2009年
5 尤红梅;蔡雪晴:优势在于执行[N];中国企业报;2004年
6 汤天浩;人工智能技术:未来船舶系统的灵魂[N];中国船舶报;2005年
7 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
8 马炳厚;知识开发的创新成果[N];科技日报;2005年
9 本报记者  胡其峰;科技信息资源如何助力自主创新[N];光明日报;2006年
10 王广宇;如何游出“数据海洋”?[N];计算机世界;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978