收藏本站
《中国科学院研究生院(计算技术研究所)》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

知识发现中粗糙集理论的研究

刘少辉  
【摘要】: 粗糙集理论是一种新型的处理含糊和不确定性知识的数学工具,它能够分析隐藏在数据中的事实而不需要关于数据的任何附加知识。该理论以其独特的优势正赢得越来越多的研究者的关注,并在各个领域获得了广泛的应用。本文介绍了粗糙集理论的基本概念和研究现状,给出了粗糙集的高效算法,并进一步研究了粗糙集理论在知识发现,特别是在聚类分析、文本分类、基于范例的推理等方面的应用。本文的研究工作主要包括如下几个方面: 粗糙集的高效算法:现有粗糙集算法计算的低效性在一定程度上限制了粗糙集理论的广泛应用,因此寻求高效的粗糙集算法具有重要的意义。深入分析了算法低效性的根源,围绕不可区分关系和正区域两个核心概念,研究了不可区分关系的性质,给出并证明了正区域的一种等价计算方法,从而得出高效的粗糙集基本算法。随后,进一步分析了正区域的渐增式计算,并给出了一种完备的属性约简算法。理论分析和实验结果表明,这些算法在效率上较现有的算法有显著提高。 基于粗糙集的聚类算法的研究:给出了局部不可区分关系、个体之间的局部不可区分度和总不可区分度、类之间的不可区分度、聚类结果的综合近似精度等定义,在此基础上提出了一种基于粗糙集的层次聚类算法RSHC,该算法能够自动调整参数,以寻求更优的聚类结果。实验结果验证了该算法的可行性,特别是在符号属性聚类方面有较好的聚类性能。 基于粗糙集的文本分类的研究:从信息粒度的角度来分析文本分类,并将粗糙集理论应用于特征选取。进而对经典的词权重计算方法进行了改进,使之更加合理。在此基础上,本文给出了一种对应多重粒度级别的多层次文本分类方法:各文档类按照一定的层次关系组织成树状结构,在对文档进行自动分类时,首先从根结点开始找到对应的大类,然后递归往下直到找到对应的叶子子类。实验和实际系统表明:该方法是行之有效的,具有较高的分类准确率与召回率。 基于粗糙集的CBR的研究:基于范例的推理(CBR)是人工智能发展较为成熟的分支,而范例检索是确保CBR成功的重要环节。目前,最常用的检索算法是k-近邻法,但该方法对噪声和不相关特征较敏感,而且需要确定各特征的权值。粗糙集理论在处理不精确数据方面有其独特的优势,基于此,将粗糙集理论应用于CBR中的范例检索:首先用粗糙集方法对源范例库进行约简,减少计算范例相似性过程中所涉及的特征个数,以提高检索效率;然后在属性重要度的基础上给出了新的计算各特征权值的方法;进而给出了几种基于粗糙集的范例检索算法。实验结果验证了这些算法的可行性,特别是在处理离散的特征时有较好的性能。 介绍了集成粗糙集高效约简算法和基于粗糙集的多层次文本分类方法的多策略知识发现平台MSMiner:首先介绍MSMiner的主要功能和体系结构,阐述了联机分析处
【学位授予单位】:中国科学院研究生院(计算技术研究所)
【学位级别】:博士
【学位授予年份】:2003
【分类号】:TP182

【相似文献】
中国期刊全文数据库 前10条
1 康向平;李德玉;;一种基于形式概念分析的粗糙集中的知识获取方法[J];山西大学学报(自然科学版);2011年03期
2 吕鸣剑;;数据挖掘在知识工程中的应用研究[J];电脑知识与技术;2011年23期
3 赵惠文;;一般模糊熵及其应用[J];信息工程大学学报;2011年03期
4 邓松;王映龙;何火娇;罗东平;袁威;;粗糙集在销售决策系统中的应用[J];计算机技术与发展;2011年09期
5 康彦;;数据挖掘技术在高职教学质量管理中的应用[J];科技创新导报;2011年20期
6 宋艳佩;李一喆;李超;吴万涛;;基于单调邻域粗糙集的特征基因提取[J];电脑知识与技术;2011年19期
7 李晶晶;肖大伟;;一种粗糙集并行离散化算法[J];科技信息;2011年20期
8 王斌;朴顺姬;邵华清;;基于粗糙集的KNN的WEB文本分类的研究[J];数字技术与应用;2011年08期
9 葛浩;李龙澍;杨传健;;可信度差别矩阵及其属性约简[J];四川大学学报(工程科学版);2011年05期
10 赵素娟;;基于可拓蚁群算法的粗糙集属性约简方法[J];现代计算机(专业版);2011年12期
中国重要会议论文全文数据库 前10条
1 赵荣珍;杨娟;黄显华;;粗糙集理论的故障知识发现及其工程应用模式研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
2 聂力;王翰虎;;一个基于粗糙集理论的分类规则学习算法[A];第十六届全国数据库学术会议论文集[C];1999年
3 赵明清;陶树平;;基于模糊等价关系的粗糙集[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
4 肖健梅;芦晓明;王锡淮;;集装箱起重机防摇系统粗糙集控制[A];第二十六届中国控制会议论文集[C];2007年
5 李晓丽;王彤;杜振龙;;基于粗糙集理论的流数据最优特征选择[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
6 王旭阳;王彤;李明;;基于粗糙集理论的分类规则挖掘方法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
7 刘永红;薛青;郑长伟;;基于粗糙集理论的C4ISR评估方法[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
8 葛丽;傅彦;;粗糙集在科学数据属性约简中的应用[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
9 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
10 顾成杰;张顺颐;刘凯;黄河;;基于粗糙集和禁忌搜索的特征选择方法[A];江苏省电子学会2010年学术年会论文集[C];2010年
中国重要报纸全文数据库 前10条
1 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
2 中国科学院计算技术研究所 刘毅勇 何雄 李金山 廖浩均 孟亮 邓柱中;空间数据挖掘:变数据为知识[N];计算机世界;2005年
3 胡虎;突出信息化贡献水平 处理好三个关系[N];人民邮电;2007年
4 陈志楠;挖掘“不为人知的艺术”[N];科技日报;2009年
5 ;栉风沐雨铸辉煌 继往开来谱华章[N];人民邮电;2006年
6 尤红梅;蔡雪晴:优势在于执行[N];中国企业报;2004年
7 汤天浩;人工智能技术:未来船舶系统的灵魂[N];中国船舶报;2005年
8 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
9 马炳厚;知识开发的创新成果[N];科技日报;2005年
10 本报记者  胡其峰;科技信息资源如何助力自主创新[N];光明日报;2006年
中国博士学位论文全文数据库 前10条
1 张国军;基于粗糙集的相对属性约简算法及决策方法研究[D];华中科技大学;2010年
2 乔梅;基于粗糙集和数据库技术的知识发现与推理方法研究[D];天津大学;2005年
3 马君华;粗糙集属性约简和聚类算法及其在电力自动化中的应用研究[D];华中科技大学;2010年
4 汪凌;基于粗糙集的不确定信息知识发现及在城市交通管理中的应用研究[D];西南交通大学;2011年
5 杨习贝;不完备信息系统中粗糙集理论研究[D];南京理工大学;2010年
6 纪霞;不完备信息系统中粗糙集理论的扩展研究与应用[D];安徽大学;2010年
7 赵佰亭;混合决策系统的粗集模型及在转台故障诊断中的应用[D];哈尔滨工业大学;2010年
8 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
9 张贤勇;基于精度与程度逻辑组合的几类粗糙集模型及其算法研究[D];四川师范大学;2011年
10 丛蓉;作战指挥决策支持系统目标融合识别研究[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 年福忠;粗糙集及其在KDD中的应用研究[D];兰州理工大学;2004年
2 唐彬;基于粗集理论的知识发现研究[D];安徽大学;2004年
3 刘震宇;粗糙集约简算法在知识发现中的研究与应用[D];西安电子科技大学;2002年
4 王玏;不完备信息系统的粗糙集模型[D];江西师范大学;2010年
5 吕望;基于粗糙集的车辆超载自动检测方法研究[D];长沙理工大学;2010年
6 田静宜;基于粗糙集和神经网络的柴油机故障诊断研究[D];中北大学;2011年
7 刘利民;基于粗糙集的分类规则挖掘的研究[D];辽宁工程技术大学;2005年
8 于兴网;粗糙集属性约简算法在数据挖掘中的研究[D];重庆大学;2004年
9 雷明;基于粗糙集理论的决策表压缩[D];华北电力大学(北京);2010年
10 魏悦亮;粗糙集在数据挖掘不确定性问题中的研究[D];中国石油大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026