收藏本站
《哈尔滨工程大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于粗糙集理论的数据挖掘算法的研究

冯为军  
【摘要】: 随着网络技术和信息技术的不断进步,数据挖掘引起了人们的广泛关注,传统的信息处理技术越来越不能很好地满足实际应用的需要。因此,人们迫切需要具有更高效率和更强能力的信息处理技术。 Pawlak提出的粗糙集理论是一种全新的处理模糊性、不确定性问题的数学工具,它无需提供数据集合之外的任何先验信息,而是利用集合上的等价关系对知识的不确定程度进行度量,这使得粗糙集理论在数据挖掘中具有更加明显的优越性。将粗糙集理论应用到数据挖掘中,需要经过数据预处理、求核属性、属性约简、规则生成等几个步骤。本文以粗糙集理论在数据挖掘过程中的步骤为线索,主要对连续属性离散化、求取决策表的核值属性、决策表的属性约简等问题进行了深入的研究。本文的主要创新工作包括: 提出一种基于粗糙集理论和OPTICS算法相结合的连续属性离散化算法。运用粗糙集理论处理决策表时,要求决策表中的值用离散数据表示。因此,在深入分析和研究几种离散化算法优缺点的基础上,提出一种基于粗糙集理论和OPTICS算法相结合的连续属性离散化算法。该算法是以粗糙集理论中的依赖度作为评价机制,更好的保持了条件属性和决策属性的不可分辨关系,该算法也是一种全局的离散化算法,离散化后的信息系统更具有整体性。通过实验验证,该算法能够得到理想的离散化结果。 提出一种改进的基于属性重要性的启发式约简算法。通过研究发现,基于属性重要性和基于信息熵作为启发信息的属性约简算法都是不完备的。综合考虑这两种启发信息,以粗糙集理论为依据,以属性重要性为主要标准,信息熵为辅助标准,提出一种改进的基于属性重要性的启发式约简算法。通过实验验证,该算法是个更加完备、更加合理的算法。
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP18

【引证文献】
中国博士学位论文全文数据库 前1条
1 雷少帅;基于内容的视频检索关键技术研究[D];太原理工大学;2012年
中国硕士学位论文全文数据库 前2条
1 丁静;疾控中心健康体检管理系统及其数据分析[D];河北科技大学;2012年
2 古赟;图像语义底层特征提取研究[D];太原理工大学;2012年
【参考文献】
中国期刊全文数据库 前7条
1 苗夺谦,胡桂荣;知识约简的一种启发式算法[J];计算机研究与发展;1999年06期
2 王国胤,于洪,杨大春;基于条件信息熵的决策表约简[J];计算机学报;2002年07期
3 王国胤;决策表核属性的计算方法[J];计算机学报;2003年05期
4 宋丹;;基于粗糙集的手写体数字识别多分类器[J];科学技术与工程;2008年10期
5 胡可云,陆玉昌,石纯一;粗糙集理论及其应用进展[J];清华大学学报(自然科学版);2001年01期
6 苗夺谦,王珏;粗糙集理论中概念与运算的信息表示[J];软件学报;1999年02期
7 胡丹,莫智文;关于粗糙集理论与信息熵的几点注记[J];四川师范大学学报(自然科学版);2002年03期
中国博士学位论文全文数据库 前1条
1 刘文军;基于粗糙集的数据挖掘算法研究[D];北京师范大学;2004年
中国硕士学位论文全文数据库 前2条
1 陈欢;基于粗糙集的数据约简及规则提取[D];福州大学;2004年
2 冷永刚;粗糙集理论约简算法的研究[D];电子科技大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
2 赵彦辉;张乐文;邱道宏;仲晓杰;;基于粗糙集理论的隧道围岩模糊综合评判[J];四川建筑科学研究;2011年02期
3 吕俊;任雪萍;;一种基于粗糙集理论的变压器故障多变量决策树诊断方法[J];安徽电气工程职业技术学院学报;2011年01期
4 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
5 徐文婷;李承鹏;;基于自适应遗传算法的离散化方法[J];合肥师范学院学报;2011年03期
6 赵鹏,倪志伟,贾瑞玉;基于数据挖掘技术的范例库维护[J];安徽大学学报(自然科学版);2003年02期
7 蔡莉;胡学钢;;一种基于粗集的决策表求核算法[J];安徽大学学报(自然科学版);2007年06期
8 周玉华;李景杰;;不完备决策表的一种属性约简方法[J];安徽大学学报(自然科学版);2009年04期
9 梁佩佩,杨丽萍;基于模糊关系数据库的聚类算法研究[J];安徽职业技术学院学报;2004年01期
10 杨萍,杨明;基于VPRS的重要属性评价方法研究[J];安徽工程科技学院学报(自然科学版);2003年01期
中国重要会议论文全文数据库 前10条
1 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 尹宗成;;粗糙集理论在我国粮食产量预测中的应用[A];现代农业理论与实践——安徽现代农业博士科技论坛论文集[C];2007年
3 危前进;董荣胜;孟瑜;崔更申;;基于粗糙集的机械装配知识发现方法[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
4 ;Fuzziness in Covering Generalized Rough Sets[A];第二十六届中国控制会议论文集[C];2007年
5 李雄;党生;;基于Rough集理论的战场侦察情报处理[A];第二十六届中国控制会议论文集[C];2007年
6 陈保家;李力;赵新泽;;基于尺度-小波能量谱、粗糙集和神经网络集成的内燃机故障诊断方法[A];第二十六届中国控制会议论文集[C];2007年
7 王印松;冯康;;主汽温调节系统性能评价的粗糙集实现方法[A];第二十七届中国控制会议论文集[C];2008年
8 方炜炜;杨炳儒;彭珍;;一种基于粗糙集的启发式属性归约的新算法[A];第二十七届中国控制会议论文集[C];2008年
9 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
10 何鹏;王雅琳;桂卫华;孔玲爽;;氧化铝硅渣成分的混沌时间序列分析与SVM预测[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
4 姜延吉;多传感器数据融合关键技术研究[D];哈尔滨工程大学;2010年
5 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
6 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
7 杨锦园;基于传感器管理的移动机器人融合算法研究[D];华中科技大学;2010年
8 任家福;服务商选择与备件备品库存管理研究[D];电子科技大学;2010年
9 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
10 苏煜;基于SCF范式的在线P300脑机接口研究[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
3 杨新忠;基于案例的地理时空过程表达模型研究[D];山东科技大学;2010年
4 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
5 雷聪聪;一种基于数据聚类的信息粒化方法[D];郑州大学;2010年
6 张晓冬;基于全矢谱的智能诊断技术研究[D];郑州大学;2010年
7 李昕哲;关系邻域系统的属性约简[D];郑州大学;2010年
8 刘琪;正态云模型模糊推理系统及其应用研究[D];郑州大学;2010年
9 王晓换;基于粗糙集和神经网络的故障诊断虚拟系统的研究[D];郑州大学;2010年
10 周霞;基于粗糙集的电子商务交易知识获取研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
2 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
3 江效尧,江伟;决策树在数据挖掘中的应用研究[J];安庆师范学院学报(自然科学版);2003年01期
4 罗森林;马舒洁;梁静;潘丽敏;冯杨;;基于子镜头聚类方法的关键帧提取技术[J];北京理工大学学报;2011年03期
5 曾万梅;吴庆宪;姜长生;;基于组合不变矩特征的空中目标识别方法[J];电光与控制;2009年07期
6 刘立辉;邱力军;漆家学;;健康体检信息系统的开发与应用[J];第四军医大学学报;2008年06期
7 成勇,须德;一种自动选取阈值的视频镜头边界检测算法[J];电子学报;2004年03期
8 耿玉亮;须德;冯松鹤;;一种快速有效的视频镜头边界检测方法[J];电子学报;2006年12期
9 谢昭;高隽;;基于高斯统计模型的场景分类及约束机制新方法[J];电子学报;2009年04期
10 孙显;王宏琦;张正;;基于对象的Boosting方法自动提取高分辨率遥感图像中建筑物目标[J];电子与信息学报;2009年01期
中国博士学位论文全文数据库 前6条
1 乔斌;粗糙集理论分层递阶约简算法的研究[D];浙江大学;2003年
2 罗可;数据库中数据挖掘理论方法及应用研究[D];湖南大学;2005年
3 陈久军;基于统计学习的图像语义挖掘研究[D];浙江大学;2006年
4 王庆东;基于粗糙集的数据挖掘方法研究[D];浙江大学;2005年
5 李宗民;矩方法及其在几何形状描述中的应用[D];中国科学院研究生院(计算技术研究所);2005年
6 万华林;图象检索中高层语义和低层可视特征的提取研究[D];中国科学院研究生院(计算技术研究所);2002年
中国硕士学位论文全文数据库 前10条
1 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
2 刘晓霞;数据挖掘技术在高校教学管理系统中的应用研究[D];中国海洋大学;2010年
3 武毅;赤峰医院体检管理系统开发及应用研究[D];大连海事大学;2010年
4 刘骏峰;综合性医院体检中心业务流程重组研究[D];华中科技大学;2010年
5 詹引;基于数据挖掘技术的个性化健康体检套餐设计[D];华中科技大学;2010年
6 孙超利;数据挖掘决策树方法的研究与应用[D];河海大学;2003年
7 鲍金梅;基于Web的健康检查管理系统的设计和实现[D];大连理工大学;2006年
8 钱少华;数据仓库及数据挖掘技术的应用的研究[D];江南大学;2004年
9 杨义姣;基于PDA和WLAN的体检信息系统研究与设计[D];中南大学;2005年
10 张兴科;基于决策树的应用研究[D];合肥工业大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 李洪兴;因素空间理论与知识表示的数学框架(Ⅰ)──因素空间的公理化定义与描述架[J];北京师范大学学报(自然科学版);1996年04期
2 叶东毅;Jelonek属性约简算法的一个改进[J];电子学报;2000年12期
3 叶东毅,陈昭炯;一个新的差别矩阵及其求核方法[J];电子学报;2002年07期
4 印勇,曹长修,张邦礼;基于粗糙集理论的分类规则发现[J];重庆大学学报(自然科学版);2000年01期
5 陈欢,叶东毅;数据过滤算法的一种改进[J];福建电脑;2004年02期
6 陶志,许宝栋,汪定伟,李冉;基于遗传算法的粗糙集知识约简方法[J];系统工程;2003年04期
7 王珏;Rough Set约简与数据浓缩[J];高技术通讯;1997年11期
8 杨会志;数据挖掘技术的主要方法及其发展方向[J];河北科技大学学报;2000年03期
9 李洪兴;模糊控制的插值机理[J];中国科学E辑:技术科学;1998年03期
10 李洪兴;模糊控制器与PID调节器的关系[J];中国科学E辑:技术科学;1999年02期
【相似文献】
中国期刊全文数据库 前10条
1 许中卫,李龙澍;基于粗糙集理论的数据挖掘算法研究[J];微机发展;2001年01期
2 项新建,Stolle.M;一种基于聚类的粗糙集连续属性的离散化算法(英文)[J];浙江科技学院学报;2003年03期
3 徐健锋;刘斓;邱桃荣;胡然;;基于二进制信息粒的数据挖掘算法研究[J];计算机科学;2008年03期
4 杨晓平,徐优红,许金权;考试成绩分析的粗糙集方法[J];浙江海洋学院学报(自然科学版);2002年04期
5 刘燕,张学庆,杨绍国;一种基于粗糙集分类的图像压缩方法[J];物探化探计算技术;2002年02期
6 蒋加伏,刁洪祥,唐贤瑛;一种基于粗糙集分类的图像增强方法[J];计算机工程与应用;2003年19期
7 冯志鹏,宋希庚,薛冬新;基于粗糙集与神经网络集成的内燃机故障诊断[J];内燃机学报;2003年01期
8 游凤荷,黄樟灿,孙砚飞,毛天祥;粗糙集的约简算法在涡流传感器设计中的应用[J];无损检测;2003年03期
9 石金彦,黄士涛,雷文平;粗糙集与决策树结合诊断故障的数据挖掘方法[J];郑州大学学报(工学版);2003年01期
10 魏彩乔,焦满囤;基于粗糙集的绿色度评价方法及实现技术[J];计算技术与自动化;2004年03期
中国重要会议论文全文数据库 前10条
1 肖健梅;芦晓明;王锡淮;;集装箱起重机防摇系统粗糙集控制[A];第二十六届中国控制会议论文集[C];2007年
2 李晓丽;王彤;杜振龙;;基于粗糙集理论的流数据最优特征选择[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
3 聂力;王翰虎;;一个基于粗糙集理论的分类规则学习算法[A];第十六届全国数据库学术会议论文集[C];1999年
4 王旭阳;王彤;李明;;基于粗糙集理论的分类规则挖掘方法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 刘永红;薛青;郑长伟;;基于粗糙集理论的C4ISR评估方法[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
6 赵明清;陶树平;;基于模糊等价关系的粗糙集[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
7 葛丽;傅彦;;粗糙集在科学数据属性约简中的应用[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
8 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
9 赵荣珍;杨娟;黄显华;;粗糙集理论的故障知识发现及其工程应用模式研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
10 顾成杰;张顺颐;刘凯;黄河;;基于粗糙集和禁忌搜索的特征选择方法[A];江苏省电子学会2010年学术年会论文集[C];2010年
中国重要报纸全文数据库 前10条
1 ;栉风沐雨铸辉煌 继往开来谱华章[N];人民邮电;2006年
2 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
3 本报记者 李智 通讯员 梁宪生;零的突破[N];山西经济日报;2001年
4 李磊;让电子政务更聪明[N];计算机世界;2001年
5 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
6 重庆邮电学院党委书记徐仲伟 院长 聂能;发挥学科优势 打造信息平台[N];科技日报;2005年
7 贵州省移动通信公司 苏思妮;让信息去主动寻找用户[N];通信产业报;2004年
8 湖北警官学院信息技术系 刘志军 王宁 麦永浩;取证技术的三大方向[N];计算机世界;2004年
9 游小霞;Oracle9i集群的力量[N];中国计算机报;2001年
10 闫春龙 邱云龙;宣钢与北京工业大学共同申报发明专利[N];世界金属导报;2011年
中国博士学位论文全文数据库 前10条
1 张国军;基于粗糙集的相对属性约简算法及决策方法研究[D];华中科技大学;2010年
2 马君华;粗糙集属性约简和聚类算法及其在电力自动化中的应用研究[D];华中科技大学;2010年
3 杨习贝;不完备信息系统中粗糙集理论研究[D];南京理工大学;2010年
4 丛蓉;作战指挥决策支持系统目标融合识别研究[D];大连理工大学;2010年
5 纪霞;不完备信息系统中粗糙集理论的扩展研究与应用[D];安徽大学;2010年
6 赵佰亭;混合决策系统的粗集模型及在转台故障诊断中的应用[D];哈尔滨工业大学;2010年
7 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
8 哈斯巴干;神经网络及其组合算法的遥感数据分类研究[D];中国科学院研究生院(遥感应用研究所);2003年
9 张贤勇;基于精度与程度逻辑组合的几类粗糙集模型及其算法研究[D];四川师范大学;2011年
10 汪凌;基于粗糙集的不确定信息知识发现及在城市交通管理中的应用研究[D];西南交通大学;2011年
中国硕士学位论文全文数据库 前10条
1 吕望;基于粗糙集的车辆超载自动检测方法研究[D];长沙理工大学;2010年
2 田静宜;基于粗糙集和神经网络的柴油机故障诊断研究[D];中北大学;2011年
3 于兴网;粗糙集属性约简算法在数据挖掘中的研究[D];重庆大学;2004年
4 雷明;基于粗糙集理论的决策表压缩[D];华北电力大学(北京);2010年
5 魏悦亮;粗糙集在数据挖掘不确定性问题中的研究[D];中国石油大学;2010年
6 袁晓娟;基于粒计算的双论域粗糙集模型研究[D];兰州大学;2010年
7 武金艳;粗糙集与证据理论在医疗智能诊断系统中的应用研究[D];湖南大学;2010年
8 穆海芳;基于粗糙集理论的故障诊断知识获取研究[D];合肥工业大学;2010年
9 李琴;基于粗糙集的商业智能决策的研究与应用[D];广东工业大学;2011年
10 张贤勇;粗糙集的数学基础研究与两个广义粗糙集模型的探讨[D];四川师范大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026