收藏本站
《中南大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

基于分类模型的知识发现机理和方法研究

蒙祖强  
【摘要】:知识发现(KDD,Knowledge Discovery in Databases)是从数据中获取知识的一种智能信息处理技术。本论文在深入分析国内外相关研究成果的基础上,首先利用粒度计算理论,独立于具体算法,展开对基于分类模型的知识发现机理的研究,以探讨信息系统中知识形成的一般性规律和内在机制,并由此分析KDD研究中若干问题及其存在的根源。然后,在充分研究多种面向KDD的计算方法的基础上,提出新的理论和方法,对个性化知识发现、效率和准确率问题以及KDD算法的早熟收敛等问题展开了研究,形成一套有效的解决方法,拓展了传统的知识发现方法。本文的主要工作及创新性成果如下: 提出并构造信息系统的知识粒度空间——超粒度空间(S_GS)和全粒度空间(AllGS),找到了定义于超粒度空间之上的格和布尔代数。利用格的性质,得到了全粒度空间.的结构模型——超树,其节点代表全粒度空间中的粒度。布尔代数、格和超树及其有关性质,进一步丰富和完善了KDD的几何和代数理论体系,初步形成了信息系统知识空间的数学模型和拓扑结构。在现有决策逻辑语言的基础上,定义用于粒度描述的正基语言,提出并研究“全粒度空间+正基语言”的粒度计算模型,找到了正基语言系统、全粒度空间和基本概念空间的关系,证明了这种关系是正基语言系统到全粒度空间的一个满射。进而分析了知识的形成机理和个性化知识发现问题存在的根源,把知识发现归结为,在全粒度空间(或超树)中搜索各目标概念的最佳粒度表示并形成其有效描述的过程。显然,该过程是基于提出的模型,而粒度空间、超树、格和布尔代数等的有关性质由此而得到完美的结合并在搜索过程中发挥重要的启发作用。同时,分析了一些KDD算法存在早熟收敛、局部知识产生的原因等,提出本文解决方法的基本思路。 基于RS理论提出完备的个性化属性约简算法——DA-FPR算法。该算法的特点是,首先构造分辨矩阵的极小全空间以及基于空间的Θ_简化运算和x_子化运算;然后在用户偏好的作用下,通过交替用运这两种运算(交替次数不超过条件属性集的大小),逐步去除用户不感兴趣的条件属性,最终使得极小全空间收敛于单目空间;最后可由单目空间直接得到所需的约简。实验表明,极小全空间的规模与训练集规模几乎无正比关系,算法时间开销主要是用于构建极小全空间;而之后的操作基本上是基于条件属性集合的简单运算,其时间开销与前面相比,是非常小的,所以算法具有较高的效率;并在与已有方法对比的基础上证实了算法的有效性。文中还从理论上证明了DA-FPR算法的有效性、收敛性和完备性。 提出规则约简算法——DA-FPDR算法和决策算法极小化算法——PA-MRS算法。前者对每一条规则去除其中用户不感兴趣的属性-值对,后者则进一步去掉用户不感兴趣的整条规则。这
【学位授予单位】:中南大学
【学位级别】:博士
【学位授予年份】:2004
【分类号】:TP182

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 蒙祖强;蔡自兴;;面向KDD的粒度计算建模研究[J];计算机科学;2006年05期
中国博士学位论文全文数据库 前3条
1 周明;基于数据挖掘的制造业采购DSS理论及方法研究[D];天津大学;2009年
2 阎高伟;基于知识的多智能体思维进化算法及其工程应用[D];太原理工大学;2007年
3 邱桃荣;面向本体学习的粒计算方法研究[D];北京交通大学;2009年
中国硕士学位论文全文数据库 前2条
1 李翠;基于链接分析的Web社区发现研究与应用[D];西安理工大学;2007年
2 李伟;基于人工免疫网络的分类算法研究[D];电子科技大学;2010年
【参考文献】
中国期刊全文数据库 前10条
1 曹元大,薛静锋;加权关联规则在基于主机的入侵检测系统中的应用(英文)[J];Journal of Beijing Institute of Technology(English Edition);2002年04期
2 叶东毅,陈昭炯;一个新的差别矩阵及其求核方法[J];电子学报;2002年07期
3 叶东毅,陈昭炯;一个改进的粗糙集属性约简算法[J];福州大学学报(自然科学版);2000年05期
4 杨炳儒,王建新;KDD中双库协同机制的研究(Ⅰ)[J];中国工程科学;2002年04期
5 杨炳儒,王建新,孙海洪;KDD中双库协同机制的研究(Ⅱ)[J];中国工程科学;2002年05期
6 王珏;Rough Set约简与数据浓缩[J];高技术通讯;1997年11期
7 孙爱军,彭新武;在生物进化与人类进化之间[J];三峡大学学报(人文社会科学版);2002年05期
8 郭艳君;文化进化论与文化相对论:批判与反思[J];哈尔滨学院学报(社会科学);2002年05期
9 毛新军,王怀民,陈火旺,刘凤歧;Agent计算的理论框架[J];计算机研究与发展;1999年11期
10 徐晋晖,张伟,石纯一,侯保华;面向结构的Agent组织形成和演化机制[J];计算机研究与发展;2001年08期
【共引文献】
中国期刊全文数据库 前10条
1 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
2 赵彦辉;张乐文;邱道宏;仲晓杰;;基于粗糙集理论的隧道围岩模糊综合评判[J];四川建筑科学研究;2011年02期
3 王傲胜;李国徽;;具有利润约束的数值型关联规则的发现[J];安徽电气工程职业技术学院学报;2006年03期
4 吕俊;任雪萍;;一种基于粗糙集理论的变压器故障多变量决策树诊断方法[J];安徽电气工程职业技术学院学报;2011年01期
5 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
6 于海涛;Rough集理论在数据约简中的应用[J];安徽教育学院学报;2004年03期
7 徐文婷;李承鹏;;基于自适应遗传算法的离散化方法[J];合肥师范学院学报;2011年03期
8 赵鹏,倪志伟,贾瑞玉;基于数据挖掘技术的范例库维护[J];安徽大学学报(自然科学版);2003年02期
9 蔡莉;胡学钢;;一种基于粗集的决策表求核算法[J];安徽大学学报(自然科学版);2007年06期
10 周玉华;李景杰;;不完备决策表的一种属性约简方法[J];安徽大学学报(自然科学版);2009年04期
中国重要会议论文全文数据库 前10条
1 陈万里;;粒计算的α_决策逻辑语言[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 尹宗成;;粗糙集理论在我国粮食产量预测中的应用[A];现代农业理论与实践——安徽现代农业博士科技论坛论文集[C];2007年
5 危前进;董荣胜;孟瑜;崔更申;;基于粗糙集的机械装配知识发现方法[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
6 张铃;张燕平;方宏彬;张沆;;不可约迭代函数系统的商空间理论[A];第二十六届中国控制会议论文集[C];2007年
7 毛军军;张铃;郑婷婷;吴涛;;基于商空间理论的商分形模型[A];第二十六届中国控制会议论文集[C];2007年
8 ;Fuzziness in Covering Generalized Rough Sets[A];第二十六届中国控制会议论文集[C];2007年
9 徐怡;李龙澍;李学俊;;扩充的基于集对联系度的粗糙集模型[A];第二十六届中国控制会议论文集[C];2007年
10 李雄;党生;;基于Rough集理论的战场侦察情报处理[A];第二十六届中国控制会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
2 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
3 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
4 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
5 姜延吉;多传感器数据融合关键技术研究[D];哈尔滨工程大学;2010年
6 陈得宇;基于MAS的智能电压控制系统研究[D];哈尔滨工程大学;2010年
7 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
8 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
9 杨锦园;基于传感器管理的移动机器人融合算法研究[D];华中科技大学;2010年
10 蒋国银;基于集成模拟的电子商务协同工作机制研究[D];华中科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
3 杨新忠;基于案例的地理时空过程表达模型研究[D];山东科技大学;2010年
4 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
5 姜念;区间自适应粒子群算法研究及其应用[D];郑州大学;2010年
6 雷聪聪;一种基于数据聚类的信息粒化方法[D];郑州大学;2010年
7 张晓冬;基于全矢谱的智能诊断技术研究[D];郑州大学;2010年
8 李昕哲;关系邻域系统的属性约简[D];郑州大学;2010年
9 刘琪;正态云模型模糊推理系统及其应用研究[D];郑州大学;2010年
10 王晓换;基于粗糙集和神经网络的故障诊断虚拟系统的研究[D];郑州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 卢启文;现代综合进化论和社会生物学[J];北京大学学报(哲学社会科学版);1988年03期
2 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
3 ;The rise of granular computing[J];重庆邮电大学学报(自然科学版);2008年03期
4 陈湘州,郑海祥,杨勇,刘祖润;一种基于退化混沌变异算子的改进遗传算法及其应用[J];长沙电力学院学报(自然科学版);2003年04期
5 朱建军,刘士新,王梦光,黄敏;供应商选择及定购计划的分析[J];东北大学学报;2003年10期
6 赵毅,原永涛;影响飞灰比电阻因素的探讨[J];电力环境保护;1996年04期
7 陈炳华,张颉,孙锐,吴少华,秦裕琨;运行参数对锅炉煤粉着火燃烧和飞灰含碳量影响的数值研究[J];动力工程;2004年04期
8 陈祝明,丁义元,向敬成;扫频非线性对线性调频连续波雷达测距精度和距离分辨力的影响[J];电子学报;1999年09期
9 刘宗田;属性最小约简的增量式算法[J];电子学报;1999年11期
10 王磊,潘进,焦李成;免疫算法[J];电子学报;2000年07期
中国博士学位论文全文数据库 前10条
1 谢志鹏;基于概念格模型的知识发现研究[D];合肥工业大学;2001年
2 刘君强;海量数据挖掘技术研究[D];浙江大学;2003年
3 于江涛;多智能体模型、学习和协作研究与应用[D];浙江大学;2003年
4 乔斌;粗糙集理论分层递阶约简算法的研究[D];浙江大学;2003年
5 陈刚;基于数据挖掘的电力营销决策支持系统的结构原理及算法研究[D];重庆大学;2004年
6 张双民;群体Agent合作求解方法的研究[D];清华大学;2004年
7 钟伟才;多智能体进化模型和算法研究[D];西安电子科技大学;2004年
8 陈万里;基于商空间理论和粗糙集理论的粒计算模型研究[D];安徽大学;2005年
9 汪祖柱;基于演化算法的多目标优化方法及其应用研究[D];安徽大学;2005年
10 耿志强;流程工业粒度数据挖掘技术研究与应用[D];北京化工大学;2005年
中国硕士学位论文全文数据库 前10条
1 汪晗;基于进化计算的多目标优化与决策方法研究[D];中国人民解放军国防科学技术大学;2002年
2 陈培军;一类非数值优化问题的思维进化计算方法研究[D];华北工学院;2004年
3 张利格;基于多智能体技术的智能决策支持系统的研究[D];河北工业大学;2004年
4 黄隽毅;关于Web数据挖掘中HITS算法的研究[D];大连理工大学;2004年
5 刘淳安;无偏好多目标优化进化算法及其应用[D];西安电子科技大学;2005年
6 王其涛;基于数据挖掘的采购决策研究[D];广东工业大学;2005年
7 钱宇华;基于粗糙集的粒度计算理论与方法研究[D];山西大学;2005年
8 何拥军;基于链接结构的web权威资源挖掘算法研究[D];湖南大学;2005年
9 陈玉明;基于信息粒与粒计算理论的数据约简研究[D];南昌大学;2005年
10 胡一俊;web超链分析应用研究[D];武汉大学;2005年
【二级引证文献】
中国期刊全文数据库 前3条
1 布乃静;赵明清;;网络信息计量方法——链接分析法及应用现状研究[J];科技信息;2012年03期
2 文庭孝;王尧;杨雅惟;刘璇;;网络链接分析应用研究综述[J];图书情报知识;2011年04期
3 云颖;袁方;刘宇;王传豹;;基于网页内容相似度和链接关系的社区发现及动态添加[J];郑州大学学报(理学版);2011年01期
中国博士学位论文全文数据库 前2条
1 张凯;水污染公共安全事件预警信息管理系统构建研究[D];华中科技大学;2011年
2 张晓勇;机器人救援仿真系统中规划和自适应协作研究[D];中南大学;2010年
中国硕士学位论文全文数据库 前8条
1 王荣华;HWME中“广义专家”群体网络研讨过程的链接结构及其分析算法研究[D];昆明理工大学;2009年
2 云颖;复杂网络中的社区发现及进化研究[D];河北大学;2011年
3 洪长昊;多智能体救援仿真系统研究[D];哈尔滨工程大学;2011年
4 彭鑫;知识进化算法在化工动态优化中的应用研究[D];华东理工大学;2012年
5 武燕;基于粗糙集—遗传算法的0-1背包问题求解[D];太原理工大学;2010年
6 徐蕾;基于成组编码的离合器压盘参数化设计关键技术研究[D];武汉理工大学;2010年
7 高广宇;多智能体差分进化算法及其在发酵过程优化中的应用[D];东北大学;2009年
8 王尧;基于网络链接分析的企业竞争情报应用研究[D];湘潭大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 潘立登,黄晓峰;用改进的遗传算法求解中国旅行商问题[J];北京化工大学学报(自然科学版);1997年01期
2 徐桂荣,王永标,龚淑云;协同进化——生物发展的全球观[J];地质科技情报;1998年02期
3 叶东毅;Jelonek属性约简算法的一个改进[J];电子学报;2000年12期
4 叶东毅,陈昭炯;一个改进的粗糙集属性约简算法[J];福州大学学报(自然科学版);2000年05期
5 杨炳儒,王建新;KDD中双库协同机制的研究(Ⅰ)[J];中国工程科学;2002年04期
6 王珏;Rough Set约简与数据浓缩[J];高技术通讯;1997年11期
7 周欣,沙朝锋,朱扬勇,施伯乐;兴趣度——关联规则的又一个阈值[J];计算机研究与发展;2000年05期
8 朱廷劭,高文;普通话句子中音节基频模式的发现[J];计算机研究与发展;2000年08期
9 潘丹,郑启伦;属性约简自寻优算法[J];计算机研究与发展;2001年08期
10 樊昀,王润生;面向内容检索的彩色图像分割[J];计算机研究与发展;2002年03期
【相似文献】
中国期刊全文数据库 前10条
1 韩惠琴,刘柏嵩,董其军;知识发现在数字图书馆中的应用[J];大学图书馆学报;2001年01期
2 张春华,李迪,陈生隘;焊接车间管理中融合知识发现的探讨和实践[J];现代制造工程;2001年12期
3 范洪冬,高奋生;土地数据库中的数据挖掘[J];农业网络信息;2005年11期
4 王志宏;;数据库中的知识发现概述[J];商场现代化;2006年24期
5 戴泳;;知识发现与知识挖掘技术及其应用[J];科技情报开发与经济;2007年26期
6 张龙;肖琬蓉;王博;;数据挖掘技术及其应用[J];甘肃科技;2007年11期
7 邱晓辉;;知识发现与数据挖掘分析[J];情报探索;2011年01期
8 楼伟进,孔繁胜;软件组件技术与知识发现系统[J];微型电脑应用;1999年12期
9 应飚,楼伟进;软件组件技术与知识发现系统[J];计算机工程与设计;2000年06期
10 冀俊忠,沙志强,刘椿年,郎青;B2C电子商务站点中知识发现的研究[J];北京工业大学学报;2003年02期
中国重要会议论文全文数据库 前10条
1 杨光飞;党延忠;;不完美数据中的知识发现研究综述[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
2 董伯儒;林少培;王永文;;工程建设MIS中的知识发现和深化[A];中国土木工程学会计算机应用分会第七届年会论文集[C];1999年
3 张世海;刘晓燕;涂庆;欧进萍;王光远;;知识发现及其在高层结构智能选型中应用[A];计算机技术在工程建设中的应用——第十二届全国工程建设计算机应用学术会议论文集[C];2004年
4 万家华;刘冰;江早;;知识发现中的可视化技术[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 赵荣珍;杨娟;黄显华;;粗糙集理论的故障知识发现及其工程应用模式研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
6 董伯儒;林少培;王永文;;工程建设MIS中的知识发现和深化[A];中国土木工程学会计算机应用分会第七届年会土木工程计算机应用文集[C];1999年
7 段培俊;周东岱;;数据挖掘研究综述[A];2003年中国智能自动化会议论文集(下册)[C];2003年
8 张文修;徐萍;米据生;吴伟志;;知识系统与知识发现[A];中国系统工程学会模糊数学与模糊系统委员会第十一届年会论文选集[C];2002年
9 阮鸣梁;陈维默;;数据挖掘技术的发展与应用[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
10 杜培军;方涛;林卉;;遥感影像库中数据挖掘与知识发现的研究[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
中国重要报纸全文数据库 前10条
1 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
2 中国科学院计算技术研究所 刘毅勇 何雄 李金山 廖浩均 孟亮 邓柱中;空间数据挖掘:变数据为知识[N];计算机世界;2005年
3 胡虎;突出信息化贡献水平 处理好三个关系[N];人民邮电;2007年
4 陈志楠;挖掘“不为人知的艺术”[N];科技日报;2009年
5 尤红梅;蔡雪晴:优势在于执行[N];中国企业报;2004年
6 汤天浩;人工智能技术:未来船舶系统的灵魂[N];中国船舶报;2005年
7 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
8 马炳厚;知识开发的创新成果[N];科技日报;2005年
9 本报记者  胡其峰;科技信息资源如何助力自主创新[N];光明日报;2006年
10 王广宇;如何游出“数据海洋”?[N];计算机世界;2003年
中国博士学位论文全文数据库 前10条
1 谢宗霞;太阳宁静区磁场流场特性知识发现的方法研究[D];哈尔滨工业大学;2010年
2 张云中;基于形式概念分析的Folksonomy知识发现研究[D];吉林大学;2012年
3 杨立;基于领域知识的知识发现研究[D];中国科学院研究生院(软件研究所);2005年
4 陈元;基于分类模型的知识发现过程研究[D];国防科学技术大学;2002年
5 李初民;基于网络管理数据库中性能数据的知识发现(KDD)研究[D];重庆大学;2001年
6 李刚;知识发现的图模型方法[D];中国科学院软件研究所;2001年
7 谢志鹏;基于概念格模型的知识发现研究[D];合肥工业大学;2001年
8 吴涛;构造性知识发现方法研究[D];安徽大学;2003年
9 刘刚;数据挖掘技术与分类算法研究[D];中国人民解放军信息工程大学;2004年
10 汤永川;关于不确定性推理理论与知识发现的研究[D];西南交通大学;2002年
中国硕士学位论文全文数据库 前10条
1 薛静;专家信息管理系统在CRM中的研究与应用——基于java技术的构架[D];西北工业大学;2001年
2 陈红叶;Web信息提取及知识发现方法研究[D];合肥工业大学;2002年
3 迟庆云;基于决策树的分类算法研究和应用[D];山东师范大学;2005年
4 王益玲;基于DCS实时信息的智能故障诊断系统的研究与设计[D];南京工业大学;2003年
5 李长源;关联规则挖掘算法研究[D];哈尔滨工程大学;2005年
6 郭国印;数据挖掘技术的研究及其在PLM中的应用[D];西北工业大学;2005年
7 谷宏群;数据挖掘中可视化方法研究[D];武汉大学;2005年
8 梁利莉;数据挖掘技术在CRM中的应用研究[D];首都经济贸易大学;2005年
9 刘娟;中药药对的量化分析与知识发现[D];成都中医药大学;2005年
10 黄律;基于粗糙集的多分类器组合及其在知识发现中的应用研究[D];长沙理工大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026