收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于邻域粗糙集的属性约简算法研究及应用

李冬  
【摘要】:粗糙集是一种能处理不精确信息的数学理论,经过多年研究和发展,已经被广泛应用于模式识别、数据挖掘等领域。邻域粗糙集作为粗糙集的扩展模型,它将等价关系泛化为邻域关系,有效的解决了粗糙集只能处理离散型数据的缺点,扩大了粗糙集理论的应用范围。属性约简是邻域粗糙集的核心内容,它能在保持信息系统分类能力不变的前提下,删除冗余的特征属性,不仅能够减少数据对存储空间的占用率,还能提高一定的决策能力。本文的研究工作如下:首先,邻域半径作为邻域粗糙集最重要的设定参数,本文证明了邻域半径对属性约简的重要性,并且结合众多的研究,在不同的应用场合下,给出了基于属性标准差的多邻域半径和单邻域半径设定方法。相比于经验法,这两种方法都能有效减少邻域半径的设定误差,最后给出了邻域半径的取值规律,该研究为变精度邻域粗糙集提供了设定邻域半径的理论支撑。然后,相比于传统的邻域粗糙集,变精度邻域粗糙集可以更好处理噪声数据,但仍然存在不足之处,主要做出如下改进:(1)在变精度邻域粗糙集中,传统属性度量函数的度量效果不佳,不能选取分类能力最好的属性。针对这个问题,提出了基于属性质量度的度量函数,该度量函数在属性重要度的基础上,将邻域内平均划分准确率作为质量因子,综合考虑了加入属性后邻域内的划分准确率和正域,并据此提出了基于属性质量度的属性约简算法。多组对比实验证明,在改变精度时,该算法也能选取最优的属性子集,提高了属性约简的质量。(2)在属性约简的正域计算中存在大量不必要的计算,导致算法时间开销大。针对这个问题,本文提出了绝对正域,并证明了正域与属性子集的单调关系以及通过对样本排序,减少了度量样本,最后对度量样本采取决策分类的策略,减少不必要的度量计算,并据此提出了基于决策分类的快速属性约简算法。多组对比实验证明,该算法减少了不必要的度量计算,提高了属性约简的速度。最后,结合这两种算法设计了基于变精度邻域粗糙集的属性约简模型,不仅能加快属性约简的速度,而且能选取最佳的属性子集。本文将该模型应用于英文垃圾邮件的分类,主要利用属性约简删除特征词集的冗余属性,来提高垃圾邮件分类器的分类性能。通过在不同变精度阈值下的实验表明,该算法能有效提高对垃圾邮件的识别率,具有一定的实际意义。


知网文化
【相似文献】
中国期刊全文数据库 前15条
1 沈林;陈建辉;;基于下近似分布的变精度邻域粗糙集属性约简算法[J];贵州大学学报(自然科学版);2017年04期
2 唐卫国;张涛;罗奕;徐晋勇;;粗糙集属性约简算法综述[J];大众科技;2015年11期
3 蔡艳婧;程实;王强;;不完备混合决策粗糙集特定类多目标属性约简[J];计算机工程与设计;2020年11期
4 徐道磊;陈培林;唐轶轩;吴尚;路宇;卞显福;;一种新的决策粗糙集最小化决策代价属性约简算法[J];微电子学与计算机;2020年08期
5 李宁;王李管;贾明涛;;基于粗糙集理论和支持向量机的岩爆预测[J];中南大学学报(自然科学版);2017年05期
6 骆公志;陈佳馨;;诱导覆盖关系下的加权多粒度粗糙集及应用[J];计算机应用研究;2021年01期
7 郑文彬;李进金;张燕兰;廖淑娇;;基于矩阵的多粒度粗糙集粒度约简方法[J];南京大学学报(自然科学);2021年01期
8 赵思雨;钱婷;;基于代数角度的变精度多粒度粗糙集的约简[J];咸阳师范学院学报;2020年02期
9 汪小燕;郭云婷;申元霞;;可变多粒度粗糙集粒度约简研究[J];哈尔滨师范大学自然科学学报;2019年01期
10 薛占熬;司小朦;王楠;朱泰隆;;基于最小/最大描述的多粒度覆盖粗糙直觉模糊集模型[J];计算机科学;2017年01期
11 钟诚;李金海;;组合多粒度粗糙集及其在教学评价中的应用[J];数码设计;2017年01期
12 李敬;王利东;;不完备信息系统中的广义多粒度双相对定量决策粗糙集[J];南京大学学报(自然科学);2017年04期
13 徐维艳;汪志南;王平心;;基于粗糙集理论的大学生就业满意度统计分析[J];淮阴工学院学报;2017年05期
14 张明;唐振民;徐维艳;杨习贝;;可变粒度粗糙集[J];计算机科学;2011年10期
15 刘家彬;闵帆;;代价敏感粗糙集研究综述[J];漳州师范学院学报(自然科学版);2011年04期
中国重要会议论文全文数据库 前20条
1 陈亮;李亚锋;赵露露;;基于粗糙集理论的Link16态势共享能力效能评估方法[A];第九届中国指挥控制大会论文集[C];2021年
2 孙林凯;;基于中心聚类粗糙集影响费用主要因素分析[A];寿命周期费用技术与科学决策[C];2015年
3 尹宗成;;粗糙集理论在我国粮食产量预测中的应用[A];现代农业理论与实践——安徽现代农业博士科技论坛论文集[C];2007年
4 刘碧森;钟守铭;陈华富;;基于支持向量机与粗糙集理论的信息处理[A];第二届全国信息获取与处理学术会议论文集[C];2004年
5 李雄;李胜利;徐宗昌;;基于粗糙集理论的状态监测与故障诊断(英文)[A];第三届全国信息获取与处理学术会议论文集[C];2005年
6 卓明;王丽珍;谭旭;;基于粗糙集近似集扩展的规则提取算法[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
7 葛丽;傅彦;;粗糙集在科学数据属性约简中的应用[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
8 孙亮;杨飞;于建均;陈梅莲;;一种基于指数粗糙集合的变精度控制器应用研究[A];第25届中国控制会议论文集(下册)[C];2006年
9 陈钉均;刘熠;李涵;吴开腾;;变精度覆盖粗糙集的新型算子研究[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
10 刘庆珍;蔡金锭;;基于粗糙集理论的电力电子电路故障诊断[A];第十六届电工理论学术年会论文集[C];2004年
11 黄伟;赵寅邦;陈乔生;王俊凯;;基于改进遗传算法和粗糙集的变压器故障诊断[A];2015年全国智能电网用户端能源管理学术年会论文集[C];2015年
12 王旭阳;王彤;李明;;基于粗糙集理论的分类规则挖掘方法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
13 励晓健;董隽;黄厚宽;;基于免疫和粗糙集合的网络入侵检测系统[A];全国计算机网络应用年会论文集(2001)[C];2001年
14 易国华;;基于粗糙集和模糊集理论的数字图像增强方法[A];第二届全国信息获取与处理学术会议论文集[C];2004年
15 赵荣珍;张优云;;基于粗糙集理论的故障实例知识资源保护问题研究[A];设备监测与诊断技术及其应用——第十二届全国设备监测与诊断学术会议论文集[C];2005年
16 王红军;张建民;徐小力;;粗糙集规则获取在旋转注水机组故障诊断中的应用[A];设备监测与诊断技术及其应用——第十二届全国设备监测与诊断学术会议论文集[C];2005年
17 唐小娟;丁树良;李瑜;;粗糙集理论在认知诊断中应用的可行性研究[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年
18 时希杰;李波;;基于粗糙集的两阶段规则提取算法与有效性度量[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
19 郭景峰;王妍妍;彭思维;李海涛;;基于粗糙集理论的遗失值填充算法的研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
20 刘明亮;吴跃民;杨明;;基于粗糙集和云理论的土地适宜性评价模型的建立[A];2006年中国土地学会学术年会论文集[C];2006年
中国博士学位论文全文数据库 前20条
1 鞠恒荣;面向态势认知的粗糙集决策方法研究[D];南京大学;2019年
2 杜文胜;优势粗糙集及其扩展模型研究[D];武汉大学;2017年
3 康蕴;灰色多粒度粗糙集理论及应用研究[D];厦门大学;2018年
4 贺晓丽;多粒度环境下的知识获取理论[D];西北大学;2018年
5 张晓霞;非负矩阵分解与粗糙集若干理论及方法研究[D];华北电力大学(北京);2018年
6 黎文善(LE VAN THIEN);基于覆盖的概率粗糙集和L-模糊变精度粗糙集研究[D];武汉大学;2015年
7 廖淑娇;代价敏感粒计算若干方法的研究[D];电子科技大学;2018年
8 包艳玲;四种粗糙集扩展模型的研究[D];陕西师范大学;2018年
9 王丽娜;基于阴影集和粗糙集的模糊聚类算法研究与应用[D];南京航空航天大学;2016年
10 贾平;基于粗糙集理论的知识发现方法研究[D];浙江大学;2008年
11 唐小娟;粗糙集理论在认知诊断中的应用[D];江西师范大学;2013年
12 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
13 谭天乐;基于粗糙集的过程建模、控制与故障诊断[D];浙江大学;2003年
14 苟光磊;基于置信优势关系的粗糙集有序决策及其应用研究[D];西南交通大学;2016年
15 张海东;基于犹豫模糊环境下的软集与粗糙集理论模型的研究[D];电子科技大学;2017年
16 高岩;覆盖粗糙集研究[D];西南交通大学;2012年
17 胡节;基于粗糙集的知识发现若干关键问题研究[D];西南交通大学;2016年
18 何童;粗糙图与它的应用[D];山东大学;2008年
19 许琦;粗糙集理论在旋转机械故障诊断技术上应用的研究[D];南京工业大学;2003年
20 刘瑶;基于邻域粗糙集的高光谱波段选择算法研究[D];哈尔滨工程大学;2017年
中国硕士学位论文全文数据库 前20条
1 李冬;基于邻域粗糙集的属性约简算法研究及应用[D];成都信息工程大学;2020年
2 李玮;基于粗糙集的属性约简算法研究与应用[D];江西师范大学;2007年
3 刘继宇;基于粗糙集分类算法的研究及应用[D];广西师范大学;2015年
4 王晨曦;粗糙集理论在属性约简及模糊聚类中的应用研究[D];山东科技大学;2019年
5 车世远;基于群搜索优化粗糙集的脑科学数据研究[D];大连海事大学;2015年
6 李气芳;多粒度覆盖粗糙集理论与约简算法[D];漳州师范学院;2012年
7 程鹏;基于粗糙集理论的数据分类及其在医学图像识别中的应用研究[D];江苏大学;2007年
8 刘月铮;基于F-粗糙集的平均代价敏感并行约简研究[D];浙江师范大学;2021年
9 张旭娜;基于优势关系决策粗糙集的上市公司财务危机预测研究[D];广西大学;2013年
10 高丽丽;覆盖粗糙集的数值刻画理论与方法研究[D];华北电力大学;2012年
11 仇丽青;粗糙集在数据挖掘中的应用研究[D];山东师范大学;2005年
12 张念;基于粗糙集理论的二手车成新率计算方法之改进及其应用研究[D];重庆理工大学;2021年
13 游小英;基于证据理论的邻域覆盖多粒度粗糙集的相对约简[D];闽南师范大学;2020年
14 常凡凡;基于关系矩阵的多粒度模糊区间集粗糙集[D];长安大学;2020年
15 乔鹏;基于PS-粗糙集的动态三支决策模型与应用[D];华北理工大学;2019年
16 周润苗;基于粗糙集智能推荐的乡村旅游微信应用平台研究[D];中南林业科技大学;2019年
17 赵若楠;基于粗糙集理论的中学数学考试分析[D];广西民族大学;2019年
18 根绒切机多吉;基于粗糙集的CNN图像识别算法研究[D];成都理工大学;2019年
19 葛雅雯;条件引发的概念漂移探测及属性约简的优化选择[D];浙江师范大学;2019年
20 刘天娇;面向身份联盟的多粒度联合身份认证研究[D];重庆邮电大学;2019年
中国重要报纸全文数据库 前1条
1 本报记者 李智 通讯员 梁宪生;零的突破[N];山西经济日报;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978