收藏本站
《广西师范大学》 2000年
收藏 | 手机打开
二维码
手机客户端打开本文

Rough集和Rough关系数据库中熵的研究

蒋运承  
【摘要】: 信息熵是度量Rough预测(Rough Set Prediction)的结果的不确定性的一种非常有效且有竞争力的方法。在Rough集中,Miao和Wang利用信息熵定义了对应的粗熵(Rough Entropy),并证明了一些重要的基本性质。Duntsch和Gediga通过定义不同的熵,给出了三种Rough预测的模型(分别为:Hoc(Q→d),H(Q→d)和丑(Q→d))。在本文的第一章中,我们讨论了Rough集理论中条件熵的表达和描述:证明了在一定条件下,由Duntsch和Gediga给出的Rough集理论中的条件熵和Rough集的粗糙性(Roughness)有一定的联系,得出了一些性质:推翻了Wang在1985年宣布的一个猜测;并建立了一个非常有价值的新结果(该结果已被《软件学报》录用),并且Duntsch和Gediga给出的一个非常重要的结果是我们所得到的新结果的特殊情况,即我们推广了Duntsch和Gediga的结果;另外,我们定义了负熵(Negative Entropy)的概念,利用负熵我们简化了条件熵H(Q→d),Hbc(d|Q)和H(d|Q)的描述和表达,并证明了有关负熵的一些有价值的性质。 在数据挖掘(DataMining)中,目前Rough集理论受到非常重要的重视,是因为在Rough集理论中新知识的获得是基于数据内部特征来描述的,它不象模糊集和D-S证据理论(模糊集需要隶属度,D-S证据理论需要先验概率)。为了获取新知识,我们需要一种好的度量方法来度量给定数据的不确定性以及度量给定数据与预测知识之间的不确定性。在信息系统理论中,许多专家认为由Shannon定义的熵是目前度量信息不确定性的一种最好的方法。另外,Pawlak定义了两个函数来刻画Rough集X的不精确性: ,oR’挚;otR’争· 基于信息理论中的熵,Duntsch和Gediga定义了Rough集中的熵和条件熵。Beaubouef定义了Rough集、Rough模式及Rough关系数据库的Rough关系的熵。在本文的第二章中,我们讨论了Pawlak定义的Rough 集的粗摘尸。00 与 Duntsch和 Gediga建立的条件嫡的联系,并得出了 几个重要的结果;详细讨论了嫡的最大值和最小值;根据 ROUgh集理论中 ,。。_————一,。_、,。__,——.._、_.l_Q_.l、。_1,、,_、,,_ 的迫切需要,我们讨论了 H—(d Q)和]Y;“一 Y;之间的关系,并得 1“----QI 出了一个非常有趣、有理论价值和实践价值的一个新结果(该结果己投《计 算机学报》);另外,我们从数学的角度对*OUgh集中的嫡(包括粗摘和条 件嫡)进行了精确的分析,说明了嫡是度量ROOgh集中不确定性的一种非 常实用的数学工具。在此基础上,我们指出了对度量 RO[Jgh集或 ROUgh关 系数据库中ROOgh关系的不确定性的方法和工具有望进一步改善和提高, 有关这方面的工作,有待于进一步研究和探索。 对于一个信息系统,摘是一个非常重要的有效的不确定性信息的数学 描述工具。信息的不确定性包括不可分辨性(indiscemibility)、模糊性 (ambiguity)和不精确性(impercision)。Rough集理论利用数据内部固有 的特征刻画了数据间不可分辨性的特点,它和模糊集中的模糊性存在着本 质的不同。许多专家认为模糊集和 ROUgh集之间是互为补充的关系。 在 ROOgh关系数据库模型中,对于每一个属性j都有一个等价关系, 并且在一些属性上的取值可以是多值的,而在传统数据库模型中属性的取 值只能是单一的,这是ROOgh关系数据库与传统数据库之间的本质区别。 Beaubouef建立了Rough关系数据库模型,定义了和传统数据库类似的关 系代数和关系操作(称为ROUgh关系代数和ROUgh关系操作),并给出了 ROUgh关系的粗嫡的定义。在本文的第三章中,我们给出了ROllgh关系数 据库中粗关系的粗摘的定义,并讨论了*。*吵关系中粗嫡的一些基本性质: 利用嫡的最大最小原则,我们讨论了RO[Jgh关系中粗嫡的最大值和最小值 问题;具体分析了两个ROUgh关系R和Q可比较要具备的一些条件;讨论 了h吧卜关系操作和粗嫡之间的一些可能的联系:并且证明了E旧)不 随ROO吵关系元组的增加而递增,也证明了E(**Q),E旧)和E(Q) 之间没有普遍意义上的联系(该结果己投《中国科学》)c有关RO[Jgh关系 操作和粗嫡之间更深层次的联系(如:ROUgh 自然连接操作与粗嫡之间的 联系)有待进一步的研究和探索。 总之,有关 ROIJgh集和 ROOgh关系数据库中摘的研究问题是目前 ROOgh 集研究中一个非常重要的课题,它具有重
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2000
【分类号】:TP311.132.3

【引证文献】
中国硕士学位论文全文数据库 前1条
1 李倩;基于信息熵和变精度粗糙集的规则不确定性度量[D];河北大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
2 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
3 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
4 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期
5 赵静娴;;基于决策树的食品安全评估研究[J];安徽农业科学;2011年32期
6 王斌;;基于聚类的决策树在玉米种质筛选中的应用[J];安徽农业科学;2011年33期
7 陈文;基于决策树的入侵检测的实现[J];安徽技术师范学院学报;2005年05期
8 覃爱明,胡昌振,谭惠民;网络攻击检测中的机器学习方法综述[J];安全与环境学报;2001年01期
9 左吉峰;乔均俭;;ID3算法的合理性证明及实验分析[J];保定学院学报;2008年04期
10 王晓红,高洪深;数据挖掘技术在大型超市中的应用研究[J];北方工业大学学报;2003年03期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
3 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
4 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
5 刘海霞;钟晓妮;周燕荣;田考聪;;决策树在居民就诊卫生服务利用影响因素研究中的应用[A];重庆市预防医学会2010年论文集[C];2011年
6 汪云亮;吕久明;刘孝刚;;基于信息熵的辐射源属性分类方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
7 叶中行;陆青;余敏杰;;计算智能在银行信贷信用分类中的应用[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年
8 徐怡;余斌;李龙澍;;粗糙集在决策树生成中的应用[A];2005中国控制与决策学术年会论文集(下)[C];2005年
9 ;Rough Set Based Autolanding Control[A];第二十三届中国控制会议论文集(下册)[C];2004年
10 刘东升;;基于Mobile Agent的分布式ID3挖掘模型[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
2 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
3 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
4 朱佳俊;不确定可拓群决策优化方法及应用[D];东华大学;2010年
5 陈进;高光谱图像分类方法研究[D];国防科学技术大学;2010年
6 管红波;食品连锁经营中的有效客户反应研究[D];东华大学;2010年
7 李军;不平衡数据学习的研究[D];吉林大学;2011年
8 魏小涛;在线自适应网络异常检测系统模型与相关算法研究[D];北京交通大学;2009年
9 王中锋;树型贝叶斯网络分类器鉴别式训练研究[D];北京交通大学;2011年
10 杨明;分布式环境下的安全策略关键技术研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
2 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
3 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
4 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
5 秦园;基于SPOT5的土地信息提取技术研究[D];大连理工大学;2010年
6 李仁良;决策树算法在临床诊断中的应用研究[D];辽宁工程技术大学;2009年
7 郑陶;基于平面向量的决策树算法在高考志愿选择系统中的应用[D];辽宁工程技术大学;2010年
8 孙怡哲;一种改进的决策树算法研究与应用[D];辽宁工程技术大学;2010年
9 黄辉;基于LSI和SVC的网页文本分类算法研究[D];长沙理工大学;2010年
10 周翔;决策支持技术在企业销售系统中的应用研究[D];中国海洋大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 张雪峰;张庆灵;;粗糙集数据分析系统MATLAB仿真工具箱设计[J];东北大学学报(自然科学版);2007年01期
2 张海军,左洪福,梁剑;基于信息熵属性约简的航空发动机送修等级决策[J];系统工程;2005年07期
3 何亚群;胡寿松;朱江;;粗糙集中不确定性测量的修正粗糙熵方法[J];海军工程大学学报;2006年04期
4 苗夺谦,胡桂荣;知识约简的一种启发式算法[J];计算机研究与发展;1999年06期
5 姚明臣,孟凡超;属性约简的一种贪心算法[J];佳木斯大学学报(自然科学版);2003年03期
6 刘立军;胡文彬;梅红岩;;基于变精度粗糙集模型的Matlab实现[J];计算机工程与应用;2007年08期
7 王国胤,于洪,杨大春;基于条件信息熵的决策表约简[J];计算机学报;2002年07期
8 刘勇;丁香乾;;一种新的粗集粗糙性度量方法[J];计算机应用;2005年S1期
9 陈湘晖,朱善君,吉吟东;基于熵和变精度粗糙集的规则不确定性量度[J];清华大学学报(自然科学版);2001年03期
10 颜艳;杨慧中;;一种基于互信息的粗糙集知识约简算法[J];清华大学学报(自然科学版);2007年S2期
中国博士学位论文全文数据库 前1条
1 孙士保;变精度粗糙集模型及其应用研究[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前1条
1 孟慧丽;粗糙集的不确定度量理论及启发式属性约简算法研究[D];河南师范大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 黄显明,易继锴;Rough集理论发展现状与应用前景[J];北京工业大学学报;2005年01期
2 刘清;基于Rough集的模态逻辑及其近似推理[J];计算机应用与软件;1999年04期
3 刘少辉,盛秋戬,吴斌,史忠植,胡斐;Rough集高效算法的研究[J];计算机学报;2003年05期
4 周永权,刘宣会;基于Rough集的牛顿迭代法求方程近似解算法[J];计算机工程与设计;2004年03期
5 王黔英;科学地形成系统的综合评价指标体系——Rough集的应用[J];小型微型计算机系统;1999年06期
6 李龙澍,倪志伟,凌成;基于Rough集的空间属性数据挖掘的研究与实践[J];系统仿真学报;2002年12期
7 王黔英;基于Rough集理论的同类人员综合评判模型及其简化[J];系统工程理论与实践;2001年04期
8 徐久成,沈钧毅,王国胤;求方程近似解方法的Rough集解释[J];计算机工程与应用;2002年22期
9 刘清;《Rough集及Rough推理》[J];计算机研究与发展;2003年02期
10 刘清;《Rough集及Rough推理》[J];计算机研究与发展;2001年07期
中国重要会议论文全文数据库 前10条
1 郭景峰;宫继兵;李莉;刘佳;;Rough关系数据库上查询事务处理的研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
2 郭景峰;李莉;宫继兵;;粗关系数据库中的粗关系运算研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
3 何义剑;姚青;洪晓光;;基于关系数据库的业务流程本体存储模式研究[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
4 吴红伟;王庆;萧建昌;周傲英;;XML键约束在关系数据库中的实现[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
5 陈欣;金远平;吕扬;;基于本体的关系数据库的语义设计模式[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 顾平;周力;;基于MDA的关系数据库的设计与实现[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 汪璟玢;郭朝珍;;基于关系数据库的空间数据管理[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
8 Chu KwangHua;;Transport Across Membranes Composed of Wavy-Rough Microtubes[A];中国流变学研究进展(2010)[C];2010年
9 ;Studies on Infection of Maize Rough Dwarf at Different Period of Duration[A];中国植物病理学会2010年学术年会论文集[C];2010年
10 岳昆;郭志懋;胥正川;周傲英;;从XML键到关系数据库函数依赖[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
中国重要报纸全文数据库 前10条
1 ;关系数据库市场保持增势[N];人民邮电;2004年
2 ;永不停顿的实时关系数据库[N];计算机世界;2002年
3 石竹;关系数据库独霸二十多年[N];计算机世界;2004年
4 本报记者 孟杰;IBM 打算将“毒蛇”袭向何方[N];政府采购信息报;2006年
5 迪文;全球关系数据库市场增长[N];中国计算机报;2004年
6 哈尔滨工业大学 王宏志;借XML高效管理数据之道[N];中国计算机报;2007年
7 上海 黄药师;关系数据库中存储过程的应用[N];电脑报;2004年
8 ;SCA加速SOA编程模型统一[N];网络世界;2005年
9 孙红英;XML数据库:正在走红[N];网络世界;2006年
10 刘庆;选好你的魔幻“立方”[N];网络世界;2006年
中国博士学位论文全文数据库 前10条
1 张守志;Rough集中若干问题的研究[D];复旦大学;2004年
2 胡峰;基于分治法的Rough集高效数据挖掘方法研究[D];西南交通大学;2011年
3 于洪;Rough Set理论及其在数据挖掘中的应用研究[D];重庆大学;2003年
4 马昕;粗糙集理论在数据挖掘领域中的应用[D];浙江大学;2003年
5 陈志辉;一体化反应堆冷却剂系统故障诊断方法研究[D];哈尔滨工程大学;2009年
6 黎方正;关系数据库的关键词检索技术研究[D];中南大学;2010年
7 王斌;面向关系数据库的关键字近似搜索技术研究[D];东北大学;2008年
8 陈一稀;基于关系数据库的遗留系统向语义Web移植的研究[D];浙江大学;2010年
9 张俊艳;城市水安全综合评价理论与方法研究[D];天津大学;2006年
10 杨鹏;面向事件感知的应急临机决策引擎研究[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 蒋运承;Rough集和Rough关系数据库中熵的研究[D];广西师范大学;2000年
2 关素洁;基于Rough集的属性与属性值约简方法研究[D];南昌大学;2011年
3 陈传明;基于Rough本体的语义搜索引擎研究[D];南昌大学;2011年
4 李佳泽;基于广义Rough集的决策系统属性约简及其Fuzzy双向拓展[D];渤海大学;2012年
5 周鑫;基于Rough集理论改进的HOG特征行人检测[D];南昌大学;2012年
6 盛晓炜;基于粗集理论的中文文本自动分类与检索研究[D];清华大学;2004年
7 俞育才;几类广义Rough集模型的代数性质及其公理化[D];宁波大学;2012年
8 侯丽珊;Rough Sets的属性约简算法研究及应用[D];山西大学;2003年
9 周志易;ComGIS在油气资源分布与勘查工作空间数据库中的研究与应用[D];长安大学;2004年
10 程慧;对象驱动的CAPP专家系统的开发研究[D];武汉科技大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026