收藏本站
《新疆医科大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘在体检人群代谢综合征智能甄别中的应用研究

闫慈  
【摘要】:目的:数据挖掘技术在医学中的应用日益广泛,但也面临诸多问题,其中数据冗余及类不平衡分类问题是数据挖掘领域承待解决的问题。本研究基于健康体检大数据,以代谢综合征智能甄别(分类)为切入点,探讨与分析Lasso特征选择与重采样技术在医学领域数据冗余及类不平衡数据分类中的可行性与应用价值。方法:数据来源于乌鲁木齐市某体检机构2014~2016年体检者信息共69267例,以代谢综合征为结果分类指标,诸多体检指标为预测分类指标,代谢综合征与非代谢综合征人群不平衡比例为1:24,以数据挖掘中常用的两种分类方法(C4.5决策树、BP神经网络)为智能分类方法,选用F-value、G-mean及AUC作为分类性能的评价指标,将Lasso特征选择与三种重采样技术(随机过采样、随机欠采样、混合采样)应用于体检代谢综合征分类研究中,通过对比分类性能的差异与分类结果的稳定性,评价Lasso特征选择与重采样技术在医学数据冗余及类不平衡数据分类中的应用可行性。结果:(1)相比原始体检数据,运用Lasso特征选择有效降低体检数据冗余并提高分类性能,体检变量由53个缩减至5个,分别是:葡萄糖测定、高密度脂蛋白胆固醇、中性粒细胞百分比、年龄和血小板平均体积。(2)计算机模拟显示:数据不平衡阻碍机器学习的分类性能,且分类性能随着不平衡比例的加剧而降低;采用重采样技术后的代谢综合征分类性能优于原类不平衡数据,3种重采样技术的分类性能略有不同,随机过采样技术最有助于提高代谢综合征的分类性能。C4.5决策树与BP神经网络的分类性能略有不同,BP神经网络分类性能略优。(3)结合运用Lasso特征选择与重采样技术使得代谢综合征的分类性能得到优化,且通过C4.5决策树分类树状图显示具有一定稳定性。结论:(1)Lasso特征选择能有效降低体检大数据的数据冗余现象,提高分类性能;数据挖掘技术有利于发现医学未知的潜在的相关指标,为医学研究提供参考。(2)采用重采样技术可提高代谢综合征的分类性能,实际应用时可关注随机过采样技术。结合多种数据挖掘技术,在医学大数据挖掘、信息发现及疾病分类中,具有潜在的应用价值。
【学位授予单位】:新疆医科大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP311.13;R589

【相似文献】
中国期刊全文数据库 前10条
1 周群;邢玉珍;杨晓庆;陈露;;武汉市某高校人群代谢综合征的患病率调查分析[J];柳州医学;2010年Z1期
2 ;代谢综合征增加肝癌风险[J];柳州医学;2011年02期
3 ;吃饭太快或致代谢综合征风险高出5倍[J];中国食品学报;2017年11期
4 郭素娟;马丽;卢义芳;杨敏;张珊珊;沈莎莎;王晓兰;;连云港50岁及以上居民不动行为与代谢综合征发生的关系[J];中国老年学杂志;2017年23期
5 方海宁;于飞;;儿童Prader-Willi综合征并发代谢综合征1例并文献复习[J];中国妇幼健康研究;2018年02期
6 梁愿;李章春;王青;卢薇;钟筑林;刘磊;许小红;张巧;;中老年2型糖尿病代谢综合征与血清分泌型卷曲相关蛋白5水平的关系[J];贵州医药;2018年03期
7 郑仁东;曹琳;刘克冕;刘超;;男性代谢综合征患者性激素结合球蛋白水平的变化[J];江苏医药;2018年05期
8 张建标;吉峰;;非典型抗精神病药物所致代谢综合征防治策略[J];济宁医学院学报;2018年03期
9 付雨;兰丽珍;;代谢综合征患者血清肿瘤坏死因子-α的水平及意义[J];世界最新医学信息文摘;2018年43期
10 赵翊;胡继宏;郑贵森;靳利梅;陈丽;卓玛草;;甘南藏族人群代谢综合征的流行病学调查[J];疾病预防控制通报;2016年06期
中国重要会议论文全文数据库 前10条
1 宋雅珊;;广西普通人群成人代谢综合征患病率横断面调查[A];2016年中国中西医结合学会肾脏疾病专业委员会学术年会论文摘要汇编[C];2016年
2 徐晓峰;;代谢综合征健康管理的策略[A];2015年浙江省医学会健康管理学分会学术年会暨健康管理学学科与学术发展论坛论文汇编[C];2015年
3 李增英;;代谢综合征的中西医治疗[A];广东省第五届中医、中西医结合防治糖尿病学术大会论文汇编[C];2005年
4 塔其一;王丽新;刘波;沈丽丽;;饮食平衡防患代谢综合征[A];2007全国中医药科普高层论坛文集[C];2007年
5 伍学焱;;雄激素与代谢综合征[A];2009年浙江省男科、泌尿外科学术年会论文汇编[C];2009年
6 金满文;沈纪中;刘毅;刘剑雄;杨蔚芹;李草;胡燕;;五甲基槲皮素对实验性代谢综合征的作用及机制研究[A];中国药理学会第十次全国学术会议专刊[C];2009年
7 聂聪;刘培;;健康评估在企业人群代谢综合征筛查以及后续工作现场健康促进项目中应用研究[A];自主创新与持续增长第十一届中国科协年会论文集(3)[C];2009年
8 李晶华;王桂茹;胡明;张秀敏;;吉林省某省直机关公务员代谢综合征调查及健康管理策略研究[A];自主创新与持续增长第十一届中国科协年会论文集(3)[C];2009年
9 伍佩英;宋晓敏;王爱蓉;庄海萍;董玲;;生活方式与代谢综合征关系的研究[A];膳食变迁对民众健康的影响:挑战与应对——第二届两岸四地营养改善学术会议学术报告及论文摘要汇编[C];2010年
10 孙唯佳;陈敏;陈艳秋;唐倩如;陈爱芳;孙玮;林轶凡;姜菁静;徐丹凤;谢华;孙建琴;;身体活动谱与代谢综合征的关系研究[A];膳食变迁对民众健康的影响:挑战与应对——第二届两岸四地营养改善学术会议学术报告及论文摘要汇编[C];2010年
中国重要报纸全文数据库 前10条
1 通讯员 王雪飞 记者 俞欣;儿童青少年代谢综合征标准出炉[N];健康报;2018年
2 周毅德 山东淄博万杰糖尿病医院;从“诸气愤郁,皆属于肺”论代谢综合征[N];中国中医药报;2015年
3 同济大学附属东方医院糖尿病与减重外科教授 朱江帆;减重手术为何能治代谢综合征[N];健康报;2015年
4 许菊芬;代谢综合征侵扰国人健康[N];市场报;2004年
5 徐亚静;中医药对代谢综合征有整体治疗作用[N];中国医药报;2012年
6 本报记者 王宁 整理;让快乐童年远离代谢综合征[N];中国食品报;2012年
7 芬信;代谢综合征患者死亡率高[N];医药经济报;2002年
8 广文;降压新标准:纠正代谢综合征[N];医药经济报;2003年
9 本报记者 魏赟;代谢综合征,这个“损友”挺面熟[N];医药经济报;2005年
10 记者 高原;散步或能避免患代谢综合征[N];新华每日电讯;2010年
中国博士学位论文全文数据库 前10条
1 汤楠;寻常型银屑病常见中医证型与代谢综合征及炎症因子的相关性研究[D];广州中医药大学;2017年
2 陈香;糖皮质激素代谢及调节异常与代谢综合征关系的研究[D];四川大学;2005年
3 郭艳英;β_3-AR基因及PPAR-γ_2基因复合变异与新疆哈萨克族人群代谢综合征的关系[D];新疆医科大学;2006年
4 曹剑;性激素、雄激素受体水平与老年男性代谢综合征的相关性研究[D];中国人民解放军军医进修学院;2007年
5 何春燕;散聚法对代谢综合征高危人群脂代谢的作用和机制研究[D];复旦大学;2007年
6 冯琼;代谢综合征的诊断、随访及吡格列酮治疗研究[D];中南大学;2007年
7 陈建鸿;代谢综合征虚、实证型的客观化研究[D];福建中医学院;2007年
8 伍佩英;β-葡聚糖对实验性代谢综合征改善作用及其机制研究[D];第二军医大学;2007年
9 勾忠平;代谢综合征药物治疗的系统评价[D];四川大学;2007年
10 潘丽丽;代谢综合征存在及组分构成的研究[D];中国人民解放军军医进修学院;2008年
中国硕士学位论文全文数据库 前10条
1 陶婷婷;Sirt1基因与Nrf2基因多态性与汉族人群代谢综合征的相关性研究[D];浙江大学;2018年
2 刘艳飞;中药治疗代谢综合征的药物筛选及分子作用机制研究[D];北京中医药大学;2018年
3 杜小红;代谢综合征与慢性肾脏病蛋白尿的相关性研究[D];南京大学;2018年
4 李艳;拉萨地区藏族老年人群代谢综合征调查及危险因素分析[D];西藏大学;2018年
5 荣右明;金昌队列人群血清胆红素与代谢综合征关系的前瞻性研究[D];兰州大学;2018年
6 王晨鸽;甘肃部分地区代谢综合征患病情况及与甲状腺结节关系的研究[D];兰州大学;2018年
7 李玲;中老年人群维生素D水平与代谢综合征的相关性研究[D];兰州大学;2018年
8 李琼;中老年人群亚临床甲状腺功能减退症与代谢综合征的相关性研究[D];兰州大学;2018年
9 闫慈;数据挖掘在体检人群代谢综合征智能甄别中的应用研究[D];新疆医科大学;2018年
10 张中攀;代谢综合征与前列腺癌的相关研究[D];新疆医科大学;2018年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026