收藏本站
《燕山大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

基于数据挖掘技术的2型糖尿病患病风险预测研究

朱亚楠  
【摘要】:糖尿病已成为继心脑血管疾病、恶性肿瘤后的第三大威胁人类健康的慢性病。随着我国人民生活水平的普遍提高以及生活节奏的加快,糖尿病患病者数量正在以惊人的速度增长,且向低龄化发展。最新调查显示,我国成年糖尿病患者高达1.14亿,呈现高发病率状态,然而知晓率、治疗率和达标率偏低。没有得到及时治疗与控制的糖尿病患者可能有心脑血管以及糖尿病足等各种并发症,这不仅严重影响了糖尿病患者的生活质量,也为家庭和社会带来了沉重的负担。因此,预防和控制2型糖尿病的发生,对于节约医疗资源、降低我国医疗支出具有重要战略意义。本文基于数据挖掘分类技术和分类器评估等相关理论,首先到秦皇岛市属医院进行原始数据采集,并利用相关的数据预处理技术进行了数据的清洗;其次,针对单一分类器的局限性,本文综合比较多个分类器(包括决策树C5.0,人工神经网络和支持向量机)的优势和劣势,运用多个评估工具进行模型的预测性能评价和质量评价,通过比较获得适合2型糖尿病患病风险预测的最优参数下的最佳分类器;第三,针对模型的可操作性和实用性,本文运用决策树C5.0算法,分别在简单个人水平、简单临床和复杂临床数据集下建立患病风险预测模型,以实现不同情况下为2型糖尿病的预警和干预提供帮助;最后,由于医疗数据的复杂性和医疗临床决策中对分类精度和算法稳定性的高度要求,本文采用Weka和Eclipse软件建立集成分类器,增强模型的鲁棒性,最终建立一个稳定性良好、学习速度快、分类效果最佳的数据挖掘模型。模型的评估结果表明,在单一分类器中,决策树C5.0模型在复杂临床数据集下的预测准确率、灵敏度、特异度、约登指数以及ROC曲线下面积均是最高的,说明决策树C5.0模型在2型糖尿病患病风险预测中的应用是最适合的,这对糖尿病高危人群的预防和医生临床诊断起到一定的指导作用,具有参考价值。但是,由于经典算法的局限性,本文加入集成算法,发现在复杂临床数据集下,使用Bagging集成算法组合多个C4.5单分类器后的分类模型的稳定性好,学习速度快,泛化能力强,分类效果最佳。
【学位授予单位】:燕山大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:R587.1;TP311.13

【相似文献】
中国期刊全文数据库 前10条
1 吕庆文,李树祥;对统计分类器的一点改进:一种分类思想[J];中国医学物理学杂志;1995年02期
2 姜萱;;利用数据挖掘技术构造医学图像分类器的研究[J];时珍国医国药;2008年08期
3 谢华;夏顺仁;张赞超;;医学图像识别中多分类器融合方法的研究进展[J];国际生物医学工程杂志;2006年03期
4 韦艳艳;李陶深;张超群;;集成分类器组合算法及其在医学诊断中的应用[J];广西大学学报(自然科学版);2013年05期
5 谢华,夏顺仁,高光金;基于分类器融合的骨髓细胞识别研究[J];计算机工程与应用;2005年27期
6 崔克彬,李战怀,张阳;DRC-BK分类器的规则筛选算法[J];医学信息;2004年09期
7 谢文娟,曾立波,王思贤,吴琼水,张燕;骨髓细胞多光谱显微图像分类器的设计[J];计算机工程与应用;2005年02期
8 曹美玲;张新峰;沈兰荪;;分类器融合技术在中医舌象老嫩识别中的应用研究[J];北京生物医学工程;2006年06期
9 涂有强;陈香;张旭;赵章琰;杨基海;;一种适用于手势动作sEMG信号识别的改进型模糊推理分类器[J];北京生物医学工程;2008年04期
10 孙利;徐伟栋;厉力华;刘伟;彭芳青;张娟;;基于双视角和多分类器信息融合的乳腺钼靶图像肿块分类研究[J];中国生物医学工程学报;2011年01期
中国重要会议论文全文数据库 前10条
1 王占一;徐蔚然;刘东鑫;郭军;;一种基于两级分类器的垃圾短信过滤方法[A];第五届全国信息检索学术会议论文集[C];2009年
2 翟静;李海宏;唐常杰;陈敏敏;李智;;可验证对象集分类器的再训练演进[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 陈继航;刘家锋;赵巍;唐降龙;;联机手写识别笔段特征分类器的学习方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
4 穆明生;;基于特征集的多种分类器模型的在线笔迹认证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
5 彭涛;左万利;赫枫龄;;基于链接上下文的分类器主题爬行技术(英文)[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
6 王岚;陈珂;迟惠生;;基于多特征组合多分类器的方法用于“与文本无关”的说话人辨认[A];第四届全国人机语音通讯学术会议论文集[C];1996年
7 谢秋玲;;应用于心电图分类的KNN-SVM分类器研究[A];2006中国控制与决策学术年会论文集[C];2006年
8 胡琼;汪荣贵;胡韦伟;孙见青;;基于级联分类器的快速人脸检测方法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
9 李兰春;王双成;杜瑞杰;;认知结构评估的动态贝叶斯网络分类器方法[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年
10 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
中国重要报纸全文数据库 前1条
1 黄明;精子分类器决定生男生女[N];广东科技报;2000年
中国博士学位论文全文数据库 前10条
1 张非;对抗逃避攻击的防守策略研究[D];华南理工大学;2015年
2 张文博;多类别智能分类器方法研究[D];西安电子科技大学;2014年
3 许劲松;智能交通中目标检测与分类关键技术研究[D];南京理工大学;2014年
4 赵作林;基于图像分析的北京地区杨树种类识别研究[D];北京林业大学;2015年
5 任亚峰;基于标注和未标注数椐的虚假评论识别研究[D];武汉大学;2015年
6 曹鹏;不均衡数据分类方法的研究[D];东北大学;2014年
7 刘明;分类器组合技术研究及其在人机交互系统中的应用[D];北京交通大学;2008年
8 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
9 王喆;面向模式表示与模式源的分类器设计方法研究[D];南京航空航天大学;2008年
10 陈海霞;面向数据挖掘的分类器集成研究[D];吉林大学;2006年
中国硕士学位论文全文数据库 前10条
1 赵春(王莹);多分类器融合系统的研究[D];福建师范大学;2008年
2 杨程;对抗环境下的垃圾短信息过滤[D];华南理工大学;2015年
3 张富元;基于多分类器决策融合的故障检测与诊断及GUI平台设计[D];浙江大学;2015年
4 张智超;基于多分类器组合的塔河林区森林类型信息提取技术[D];东北林业大学;2015年
5 王震;基于OLI影像的多分类器组合方法研究[D];中国地质大学(北京);2015年
6 涂盛慧;基于关键词的非法实验申请分类系统的设计与实现[D];西北农林科技大学;2015年
7 钱秀娟;贝叶斯网络在老年人普适健康监测服务中的应用研究[D];南京理工大学;2015年
8 杨胜智;SAR图像自动分类器构造与算法的研究[D];天津理工大学;2015年
9 李莎莎;多级分类器构建及在不平衡数据的应用研究[D];闽南师范大学;2015年
10 张小龙;基于级联支持向量机融合多特征的人脸检测[D];上海交通大学;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026