收藏本站
《合肥工业大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于二进制可辨矩阵的属性约简研究

汪小燕  
【摘要】:数据挖掘(DM)是从数据中提取人们感兴趣的、潜在的、可用的知识,并表示成用户可理解的形式。分类是数据挖掘的一个重要分支,粗糙集方法是数据挖掘中的重要分类技术之一。粗糙集理论是一种处理模糊和不精确知识的数学工具,它具有很强的知识获取能力。粗糙集理论在数据挖掘中的应用是一个较新的研究领域。由于粗糙集理论提供了严格的处理数据分类问题的数学方法,不需要任何数据的附加信息,能够搜索数据的最小集合,可以使用定性与定量的数据,并从数据中产生决策规则集合等优点而得到广泛的应用。 对于分类来说,并非所有的条件属性都是必要的,有些是多余的,去除这些属性不会影响原来的分类效果,反而会提高系统潜在知识的清晰度。决策表的属性约简就是约简决策表中的条件属性,约简后的决策表具有约简前决策表的功能,但是约简后的决策表具有更少的条件属性。 本文主要对粗糙集理论中的二进制可辨矩阵进行研究,研究了基于二进制可辨矩阵的知识粒度的有关理论和计算公式。利用获得的公式可计算知识的分辨度和粒度,以及属性的重要度。并利用得出的有关理论进行决策表的属性约简和值约简,提出了两种约简算法:一种是基于二进制可辨矩阵的属性及属性值约简算法,该算法只要扫描一次二进制可辨矩阵,就可求得核属性和去除核属性后,所增加的不能被正确分类的对象,从而得出核值。同时将吸收律应用于各析取式,可求得条件属性的约简集,从而得到具有约简属性的核值表。该算法使得属性约简和属性值约简得以一致计算,大大缩短了约简时间。 另一种是基于二进制可辨矩阵的重要度的属性及属性值约简算法(BDMSR):该算法利用二进制可辨矩阵的属性重要度作为属性选择标准,以在获取核属性的基础上,通过逐个增加属性构成决策表的最小约简。该算法也使得属性约简和属性值约简得以一致计算。 此外,我们设计了基于BDMSR算法和基于二进制可辨矩阵的属性约简算法(BDMR)的原型系统,在此统一的平台上,我们通过对UCI提供的多个标准测试数据集进行测试,对两种算法的性能进行比较。实验证明,BDMSR算法确实优于BDMR算法。
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP311.13

【引证文献】
中国硕士学位论文全文数据库 前1条
1 张兴科;基于决策树的应用研究[D];合肥工业大学;2007年
【参考文献】
中国期刊全文数据库 前10条
1 白燕娥,崔广才;基于遗传算法的属性约简算法研究与实现[J];长春理工大学学报;2005年03期
2 陶志,许宝栋,汪定伟,李冉;基于遗传算法的粗糙集知识约简方法[J];系统工程;2003年04期
3 牛力;数据挖掘中的统计分析技术应用研究[J];广西师范大学学报(哲学社会科学版);2002年S1期
4 苗夺谦,胡桂荣;知识约简的一种启发式算法[J];计算机研究与发展;1999年06期
5 王小晟,吴顺祥;对几种处理不确定性信息的理论的比较研究[J];计算机工程与应用;2005年12期
6 芦晓红,陈世权,吴今培;基于可辨识矩阵的启发式属性约简方法及其应用[J];计算机工程;2003年01期
7 林嘉宜,彭宏,郑启伦;一种新的基于粗糙集的值约简算法[J];计算机工程;2003年04期
8 陈文林,郝丽娜,徐心和;粗糙集-神经网络-专家系统混合系统及其应用[J];计算机工程;2003年09期
9 杨振峰,郭景峰,常峰;一种基于粗集的值约简方法[J];计算机工程;2003年09期
10 周海岩,兀丽娟;关于二进制可辩矩阵的化简算法注记[J];太原师范学院学报(自然科学版);2003年02期
中国硕士学位论文全文数据库 前1条
1 李银花;基于粗糙集理论的属性约简算法研究及应用[D];华北工学院;2004年
【共引文献】
中国期刊全文数据库 前10条
1 于海涛;Rough集理论在数据约简中的应用[J];安徽教育学院学报;2004年03期
2 尹荣章,郑诚;一个基于关系数据库的联机分析处理系统的设计与实现[J];安徽大学学报(自然科学版);2001年01期
3 孟庆全;徐文龙;;粗糙集合在中医诊断中的应用研究[J];安徽大学学报(自然科学版);2006年04期
4 杨萍,杨明;基于VPRS的重要属性评价方法研究[J];安徽工程科技学院学报(自然科学版);2003年01期
5 杨萍,万上海,陈耿;一种基于可变支持度的缺省规则挖掘算法[J];安徽工程科技学院学报(自然科学版);2004年02期
6 孙全玲;基于粗集和神经网络的建模方法研究[J];安徽建筑工业学院学报(自然科学版);2005年02期
7 李建洋;倪志伟;刘慧婷;;粗糙集在CBR中的应用研究[J];安徽建筑工业学院学报(自然科学版);2006年01期
8 秦宗贵;;OLAP技术及其在电信行业中的应用[J];安徽科技;2006年06期
9 仲红,谢荣传;基于Web的数据仓库[J];安徽师范大学学报(自然科学版);2002年02期
10 吴军,梁冰;基于粗糙集和自适应神经网络集成理论的边坡稳定性分析[J];安徽师范大学学报(自然科学版);2005年03期
中国重要会议论文全文数据库 前10条
1 杨静;;基于数据仓库决策分析的电力系统应用研究[A];安徽省电机工程学会优秀学术论文集(2002-2003)[C];2005年
2 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
3 庞清乐;曹银杰;穆健;郎丰法;;基于粗集理论的小电流接地系统故障选线研究[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
4 谢刚;;基于变精度粗集的战略石油储备规模预测方法[A];提高全民科学素质、建设创新型国家——2006中国科协年会论文集[C];2006年
5 魏崇辉;金福禄;何亚群;;基于粗糙集和神经网络的空军航材消耗预测方法[A];江苏省自动化学会七届四次理事会暨2004学术年会青年学者论坛论文集[C];2004年
6 孔秋菊;胡寿松;;基于知识的歼击机起飞爬升阶段的故障诊断与报警[A];江苏省自动化学会七届四次理事会暨2004学术年会青年学者论坛论文集[C];2004年
7 苏宏升;;基于粗糙集理论多区域并行神经分类器在变电站故障诊断中的应用[A];2005年全国自动化新技术学术交流会论文集[C];2005年
8 苏宏升;;一种基于粗集的电力系统调度新方法[A];第十七届全国过路控制会议论文集[C];2006年
9 张卫丰;徐宝文;崔自峰;徐峻岭;;一种基于粗糙集角分类神经网络的文档分类方法(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
10 汪云亮;吕久明;刘孝刚;;基于信息熵的辐射源属性分类方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
中国博士学位论文全文数据库 前10条
1 钟波;基于软计算理论的电力系统可靠性评估模型与算法研究[D];重庆大学;2004年
2 魏立梅;聚类分析新方法的研究与应用[D];西安电子科技大学;1998年
3 陈燕;数据仓库的设计与实现[D];大连理工大学;2000年
4 李刚;知识发现的图模型方法[D];中国科学院软件研究所;2001年
5 王寅;化工过程混合建模问题研究[D];浙江大学;2001年
6 曹蓟光;联机分析挖掘处理技术(OLAM)的研究[D];浙江大学;2001年
7 孙颖楷;内燃机智能故障诊断系统的研究及应用[D];重庆大学;2001年
8 曹龙汉;柴油机智能化故障诊断技术研究[D];重庆大学;2001年
9 李立新;安全数据库及其应用系统研究[D];重庆大学;2001年
10 许志兴;粗集理论的若干技术及其应用研究[D];南京航空航天大学;2001年
中国硕士学位论文全文数据库 前10条
1 罗雅博;基于粗糙集的时态数据挖掘研究[D];湘潭大学;2004年
2 熊回香;网络信息检索及其发展趋势研究[D];华中师范大学;2003年
3 黄志勇;基于支持向量机的交通标志识别系统的研究[D];北京工业大学;2004年
4 曹建平;生物信息学方法研究蛋白质相互作用[D];电子科技大学;2005年
5 蒋汉桥;基于支持向量机的证券投资决策研究[D];武汉大学;2005年
6 丁全龙;支持知识自动获取的造林专家系统的研究与探索[D];北京林业大学;2006年
7 陈鑫影;基于粗糙集理论的约简算法研究[D];吉林大学;2005年
8 郑涛;基于数据元标准与粗糙集的数据挖掘技术研究[D];西南农业大学;2005年
9 周英;基于实例的注射模设计技术研究[D];西北工业大学;2005年
10 杨攀;基于WUM个性化推荐方法研究[D];合肥工业大学;2005年
【同被引文献】
中国期刊全文数据库 前9条
1 黄晓芳;数据挖掘中决策树算法及其应用[J];兵工自动化;2005年02期
2 于凤;机器学习方法及其技术应用[J];电脑学习;2003年01期
3 赵卫东,盛昭瀚,何建敏;粗糙集在决策树生成中的应用[J];东南大学学报(自然科学版);2000年04期
4 谢志鹏,张 卿,刘宗田;基于粗糙集合理论的决策树生成[J];计算机工程与应用;2000年11期
5 韩慧,毛锋,王文渊;数据挖掘中决策树算法的最新进展[J];计算机应用研究;2004年12期
6 糜元根;数据挖掘方法的评述[J];南京化工大学学报(自然科学版);2001年05期
7 罗海蛟,刘显;数据挖掘中分类算法的研究及其应用[J];微机发展;2003年S2期
8 朱红;基于Rough Set的属性及属性值简约的一种算法[J];湘潭大学自然科学学报;2002年03期
9 谭旭,王丽珍,卓明;利用决策树发掘分类规则的算法研究[J];云南大学学报(自然科学版);2000年06期
中国硕士学位论文全文数据库 前2条
1 李银花;基于粗糙集理论的属性约简算法研究及应用[D];华北工学院;2004年
2 贾亚莉;基于粗糙集的多变量决策树的应用研究[D];合肥工业大学;2005年
【二级参考文献】
中国期刊全文数据库 前10条
1 崔广才,尹巧珍;一种基于遗传算法的属性约简算法[J];长春理工大学学报;2003年03期
2 陶志,许宝栋,汪定伟,李冉;一种基于粗糙集理论的连续属性离散化方法[J];东北大学学报(自然科学版);2003年08期
3 袁保奎,郭基伟,唐国庆,卢毅;基于粗糙集理论的变压器故障分类[J];电力系统及其自动化学报;2001年05期
4 刘宗田;属性最小约简的增量式算法[J];电子学报;1999年11期
5 苏毅娟,严小卫;一种改进的频繁集挖掘方法[J];广西师范大学学报(自然科学版);2001年03期
6 潘丹,郑启伦;属性约简自寻优算法[J];计算机研究与发展;2001年08期
7 苗夺谦,胡桂荣;知识约简的一种启发式算法[J];计算机研究与发展;1999年06期
8 于洪,杨大春,吴中福,李华;基于信息熵的一种属性约简算法[J];计算机工程与应用;2001年17期
9 李侃,刘玉树,王蕾;一种粗糙集属性约简算法[J];计算机工程与应用;2002年05期
10 程岩,黄梯云;基于Rough Set理论发现最小归纳依赖关系的方法研究[J];计算机工程;2000年03期
【相似文献】
中国期刊全文数据库 前10条
1 刘曼玲;范洁;;基于粗糙集的孤立点检测算法[J];微计算机信息;2009年33期
2 Abdulfetah Abdulahi Ahmed;李睿;张大方;;时序信息系统获取方法研究[J];计算技术与自动化;2005年04期
3 薛庆增;李冬;孙涛;邓斌;孙波;;基于粗糙集理论的振动信号数据挖掘研究[J];航空计算技术;2010年06期
4 郭军华;粗糙集理论在数据挖掘中的应用[J];科技广场;2005年05期
5 李敏;李德山;;基于粗糙集关联规则算法的研究[J];海南师范大学学报(自然科学版);2008年04期
6 吕韩飞;;基于包含度的VC成绩分析[J];科技情报开发与经济;2009年05期
7 肖萍,张彤,姜迪刚,邓晶;一种粗糙集知识挖掘算法的实现[J];中山大学学报(自然科学版);2005年S1期
8 李博;窦盼英;;基于不完备信息系统的粗糙分类研究[J];计算机工程与应用;2006年12期
9 王冬;李恩良;赵同林;;数据挖掘在造林成活率中的应用[J];商情(教育经济研究);2008年04期
10 张赢;李琛;;基于粗糙集理论的神经网络研究及应用[J];控制与决策;2007年04期
中国重要会议论文全文数据库 前10条
1 盛立;刘希玉;高明;;基于粗糙集理论的数据挖掘算法研究[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年
2 刘明亮;吴跃民;杨明;;基于粗糙集和云理论的土地适宜性评价模型的建立[A];2006年中国土地学会学术年会论文集[C];2006年
3 张文明;薛青;;粗糙集方法在作战仿真数据挖掘中的应用[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
4 李永敏;朱善君;吉吟东;陈湘晖;;一种基于近似推理的数据挖掘算法[A];1998中国控制与决策学术年会论文集[C];1998年
5 李天瑞;徐扬;;基于粗糙集的一种挖掘分类规则算法[A];2001年中国管理科学学术会议论文集[C];2001年
6 易向军;宋威;;数据挖掘技术在冶金MES中的应用探讨[A];冶金自动化信息网年会论文集[C];2004年
7 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
8 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
9 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
10 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 苏健;基于粗糙集的数据挖掘与决策支持方法研究[D];浙江大学;2002年
2 郑文钟;基于数据挖掘和系统集成的农业机械化信息管理系统研究[D];浙江大学;2005年
3 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
4 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
5 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
6 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
7 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
8 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
9 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
10 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 黄文涛;在数据挖掘中概念格的理论研究[D];兰州理工大学;2007年
2 陈鑫影;基于粗糙集理论的约简算法研究[D];吉林大学;2005年
3 梁美莲;不完备信息系统中数据挖掘的粗糙集方法[D];广西大学;2005年
4 汪小燕;基于二进制可辨矩阵的属性约简研究[D];合肥工业大学;2006年
5 何国建;基于粗糙集理论与遗传算法的分类算法研究[D];西南交通大学;2005年
6 杨志勇;基于粗糙集的Web日志挖掘研究[D];兰州理工大学;2006年
7 何田;基于粗糙集和概念格的关联规则挖掘研究[D];华中师范大学;2008年
8 廖超;基于粗糙集理论的时间序列数据分析[D];中南大学;2005年
9 向仁军;基于粗糙集理论数据挖掘方法在边坡安全评价中的应用[D];中南大学;2005年
10 陈伟统;基于粗糙集理论的网络入侵检测方法[D];浙江大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026