收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于改进邻域粗糙集和随机森林算法的糖尿病预测研究

胡玮  
【摘要】:糖尿病已成为全球危害性较大的慢性疾病之一,而中国更是全球糖尿病第一大国,近年来患病率还呈现出逐年增高的趋势,严重影响人类健康。并且随着医疗服务水平的不断提高,人们对医疗诊断效率以及准确率有了更高的要求。目前该疾病的诊断主要是在化验的基础上由医生人工诊断完成,但是糖尿病的潜伏期较长,而且各地区医疗资源不协调。针对以上这些问题,论文采集了国家人口与健康科学数据共享服务平台某医院糖尿病数据,并针对邻域粗糙集的只依赖单属性计算重要度的不足,提出了改进的邻域粗糙集(INRS)属性约简算法,后将其与随机森林(RF)组成分类预测模型应用在糖尿病数据上,形成了高精度的糖尿病预测模型,旨为医生临床诊断和疾病研究等提供辅助支持,提高临床诊断治疗水平。本文分别使用MATLAB和WEKA实现糖尿病数据的改进的邻域粗糙集(INRS)属性约简和随机森林(RF)分类预测。后面为探讨该组合模型的成效,分别从属性约简和分类器选择两个方面进行了对比分析。首先从属性约简效果分析,分别以不约简、粗糙集约简、邻域粗糙集约简和改进的邻域粗糙集算法建立特征模型,并将约简后的数据使用随机森林分类器评估效果,发现约简后的数据明显比不约简好,分类更准确,而改进后的邻域粗糙集虽然属性个数比未改进的多,但分类准确率最优,说明改进算法有改善。然后从分类器选择效果分析,对INRS约简后的数据使用随机森林算法、BP算法、C4.5算法及Naive Byes算法分类器从建模耗时、误差、分类准确率、ROC面积四个方面进行对比分析,发现综合效果最优的是随机森林分类器。综上,本论文中的基于改进的邻域粗糙集和随机森林的组合模型得到的糖尿病预测模型的分类准确率达到92.05%,其综合效果甚佳。通过本次研究希望后续可以将糖尿病预测功能添加到医院的诊疗系统中,进而辅助医生对糖尿病诊断做出科学的诊断决策。


知网文化
【相似文献】
中国期刊全文数据库 前15条
1 李文钰;许双武;徐加阳;王秋婷;路云龙;;基于粗糙集理论的多标度层次分析教师教学评价模型[J];数学学习与研究;2017年11期
2 黄爱萍;黄凤英;;基于覆盖粗糙集的超图连通性[J];数码设计;2016年02期
3 刘艳芳;陈雪云;;关系粗糙集的邻域拟阵结构研究[J];数码设计;2016年02期
4 薛占熬;司小朦;王楠;朱泰隆;;基于最小/最大描述的多粒度覆盖粗糙直觉模糊集模型[J];计算机科学;2017年01期
5 胡成祥;赵国柱;;优势关系多粒度粗糙集中近似集动态更新方法[J];中国科学技术大学学报;2017年01期
6 钟诚;李金海;;组合多粒度粗糙集及其在教学评价中的应用[J];数码设计;2017年01期
7 张凯;杨靖;;粗糙集理论及其应用综述[J];物联网技术;2017年06期
8 李敬;王利东;;不完备信息系统中的广义多粒度双相对定量决策粗糙集[J];南京大学学报(自然科学);2017年04期
9 王佳琪;苗夺谦;张红云;;基于可变多粒度概率粗糙集的分类模型[J];模式识别与人工智能;2017年08期
10 孟慧丽;马媛媛;徐久成;;基于下近似分布粒度熵的变精度悲观多粒度粗糙集粒度约简[J];计算机科学;2016年02期
11 沈家兰;汪小燕;申元霞;;可变程度多粒度粗糙集[J];小型微型计算机系统;2016年05期
12 殷杰;董斌彬;;粗糙集理论在国内旅游研究中的应用[J];旅游纵览(下半月);2014年07期
13 孟慧丽;马媛媛;徐久成;;基于信息量的悲观多粒度粗糙集粒度约简[J];南京大学学报(自然科学);2015年02期
14 江飞;;粗糙集理论在故障诊断中的应用研究[J];科技视界;2015年16期
15 方向;张旺;凌俊斌;;粗糙集理论在输变电工程造价风险评价指标体系优化中的应用[J];土木工程与管理学报;2015年04期
中国重要会议论文全文数据库 前10条
1 尹宗成;;粗糙集理论在我国粮食产量预测中的应用[A];现代农业理论与实践——安徽现代农业博士科技论坛论文集[C];2007年
2 刘碧森;钟守铭;陈华富;;基于支持向量机与粗糙集理论的信息处理[A];第二届全国信息获取与处理学术会议论文集[C];2004年
3 李雄;李胜利;徐宗昌;;基于粗糙集理论的状态监测与故障诊断(英文)[A];第三届全国信息获取与处理学术会议论文集[C];2005年
4 卓明;王丽珍;谭旭;;基于粗糙集近似集扩展的规则提取算法[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
5 葛丽;傅彦;;粗糙集在科学数据属性约简中的应用[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 孙亮;杨飞;于建均;陈梅莲;;一种基于指数粗糙集合的变精度控制器应用研究[A];第25届中国控制会议论文集(下册)[C];2006年
7 陈钉均;刘熠;李涵;吴开腾;;变精度覆盖粗糙集的新型算子研究[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
8 刘庆珍;蔡金锭;;基于粗糙集理论的电力电子电路故障诊断[A];第十六届电工理论学术年会论文集[C];2004年
9 黄伟;赵寅邦;陈乔生;王俊凯;;基于改进遗传算法和粗糙集的变压器故障诊断[A];2015年全国智能电网用户端能源管理学术年会论文集[C];2015年
10 王旭阳;王彤;李明;;基于粗糙集理论的分类规则挖掘方法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国博士学位论文全文数据库 前10条
1 黎文善(LE VAN THIEN);基于覆盖的概率粗糙集和L-模糊变精度粗糙集研究[D];武汉大学;2015年
2 廖淑娇;代价敏感粒计算若干方法的研究[D];电子科技大学;2018年
3 包艳玲;四种粗糙集扩展模型的研究[D];陕西师范大学;2018年
4 王丽娜;基于阴影集和粗糙集的模糊聚类算法研究与应用[D];南京航空航天大学;2016年
5 谭天乐;基于粗糙集的过程建模、控制与故障诊断[D];浙江大学;2003年
6 乔斌;粗糙集理论分层递阶约简算法的研究[D];浙江大学;2003年
7 何亚群;基于粗糙集的智能决策理论与应用研究[D];南京航空航天大学;2005年
8 马玉良;知识获取中的Rough Sets理论及其应用研究[D];浙江大学;2005年
9 张勇;粗糙集—神经网络智能系统在浮选过程中的应用研究[D];大连理工大学;2006年
10 王加阳;面向海量数据的粗糙集理论与方法研究[D];中南大学;2005年
中国硕士学位论文全文数据库 前10条
1 景嫄;多粒度区间集概率粗糙集模型[D];长安大学;2018年
2 唐玲玉;基于三层粒结构的三支加权互补熵[D];四川师范大学;2018年
3 袁艺林;模糊粗糙近似算子的构造研究及其在农业中的应用[D];河南师范大学;2018年
4 罗丽娟;基于粗糙集—支持向量机的建筑施工安全预警研究[D];哈尔滨工业大学;2018年
5 张鑫;基于粗糙集的图匹配算法[D];西安建筑科技大学;2018年
6 陈扬;基于优势关系的增量信息系统属性约简方法研究[D];哈尔滨工业大学;2018年
7 郭娜娜;优势关系下基于浓缩矩阵的属性约简方法[D];河北大学;2018年
8 王雪静;基于聚类的多粒度属性约简方法研究[D];河北大学;2018年
9 张明;基于粗糙集和证据理论的信息融合故障诊断方法[D];杭州电子科技大学;2018年
10 刘艳玲;单值中智粗糙集的拓扑结构及模型推广研究[D];陕西师范大学;2018年
中国重要报纸全文数据库 前2条
1 本报记者 李智 通讯员 梁宪生;零的突破[N];山西经济日报;2001年
2 重庆邮电学院党委书记徐仲伟 院长 聂能;发挥学科优势 打造信息平台[N];科技日报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978