收藏本站
《新疆医科大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘在体检人群代谢综合征智能甄别中的应用研究

闫慈  
【摘要】:目的:数据挖掘技术在医学中的应用日益广泛,但也面临诸多问题,其中数据冗余及类不平衡分类问题是数据挖掘领域承待解决的问题。本研究基于健康体检大数据,以代谢综合征智能甄别(分类)为切入点,探讨与分析Lasso特征选择与重采样技术在医学领域数据冗余及类不平衡数据分类中的可行性与应用价值。方法:数据来源于乌鲁木齐市某体检机构2014~2016年体检者信息共69267例,以代谢综合征为结果分类指标,诸多体检指标为预测分类指标,代谢综合征与非代谢综合征人群不平衡比例为1:24,以数据挖掘中常用的两种分类方法(C4.5决策树、BP神经网络)为智能分类方法,选用F-value、G-mean及AUC作为分类性能的评价指标,将Lasso特征选择与三种重采样技术(随机过采样、随机欠采样、混合采样)应用于体检代谢综合征分类研究中,通过对比分类性能的差异与分类结果的稳定性,评价Lasso特征选择与重采样技术在医学数据冗余及类不平衡数据分类中的应用可行性。结果:(1)相比原始体检数据,运用Lasso特征选择有效降低体检数据冗余并提高分类性能,体检变量由53个缩减至5个,分别是:葡萄糖测定、高密度脂蛋白胆固醇、中性粒细胞百分比、年龄和血小板平均体积。(2)计算机模拟显示:数据不平衡阻碍机器学习的分类性能,且分类性能随着不平衡比例的加剧而降低;采用重采样技术后的代谢综合征分类性能优于原类不平衡数据,3种重采样技术的分类性能略有不同,随机过采样技术最有助于提高代谢综合征的分类性能。C4.5决策树与BP神经网络的分类性能略有不同,BP神经网络分类性能略优。(3)结合运用Lasso特征选择与重采样技术使得代谢综合征的分类性能得到优化,且通过C4.5决策树分类树状图显示具有一定稳定性。结论:(1)Lasso特征选择能有效降低体检大数据的数据冗余现象,提高分类性能;数据挖掘技术有利于发现医学未知的潜在的相关指标,为医学研究提供参考。(2)采用重采样技术可提高代谢综合征的分类性能,实际应用时可关注随机过采样技术。结合多种数据挖掘技术,在医学大数据挖掘、信息发现及疾病分类中,具有潜在的应用价值。
【学位授予单位】:新疆医科大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP311.13;R589

【参考文献】
中国期刊全文数据库 前10条
1 戈娜;郭维加;杨栋;孙惠力;易铁钢;李顺民;;基于数据挖掘李顺民治疗慢性肾脏病用药规律及特点研究[J];国际中医中药杂志;2017年04期
2 吴跃跃;徐炯;刘军;黄新梅;杨敏;陈灶萍;盛励;王芳;孙田歌;顾勇;洪洋;查英;韩小洁;;老年人代谢综合征与血细胞计数比值及白细胞计数的相关性研究[J];中华老年医学杂志;2016年05期
3 曾琪;刘翔;;贝叶斯分类算法研究[J];生物技术世界;2015年11期
4 曲翌敏;江宇;;健康大数据的来源与应用[J];中华流行病学杂志;2015年10期
5 杨望灿;张培林;吴定海;陈彦龙;;基于改进半监督局部保持投影算法的故障诊断[J];中南大学学报(自然科学版);2015年06期
6 李萍;吴涛;;协同半监督的构造性学习方法[J];计算机工程与应用;2015年03期
7 肖爽;赵庆华;;数据挖掘中的关联规则在住院患者跌倒事件防范中的运用[J];中华护理杂志;2014年10期
8 刘建伟;刘媛;罗雄麟;;半监督学习方法[J];计算机学报;2015年08期
9 朱巧;郭丽君;;平均血小板体积与心血管疾病的关系[J];中国心血管杂志;2014年03期
10 李勇;刘战东;张海军;;不平衡数据的集成分类算法综述[J];计算机应用研究;2014年05期
中国博士学位论文全文数据库 前2条
1 房晓南;基于半监督和集成学习的不平衡数据特征选择和分类[D];山东师范大学;2016年
2 沈晔;计算机辅助医学影像诊断中的关键学习技术研究[D];浙江大学;2014年
中国硕士学位论文全文数据库 前7条
1 刘丹;Cox模型及变系数Cox模型中的变量选择问题研究[D];暨南大学;2016年
2 戴海涛;智能穿戴设备数据分析技术的研究与应用[D];北方工业大学;2016年
3 闫欣;综合过采样和欠采样的不平衡数据集的学习研究[D];东北电力大学;2016年
4 刘凯;数据挖掘中类不平衡数据集分类模型研究[D];辽宁科技大学;2014年
5 吴硕;红细胞参数与代谢综合征及其组分的关联性研究[D];山东大学;2014年
6 欧阳源遊;基于混合采样的非平衡数据集分类研究[D];重庆大学;2014年
7 刘爱萍;等距特征映射算法的改进及其应用[D];常州大学;2011年
【共引文献】
中国期刊全文数据库 前8条
1 闵行;褚晶辉;吕卫;;组合降采样极限学习机[J];信息技术;2015年11期
2 吕小红;;癌症住院患者跌倒的临床特征及其诱因分析[J];广西医学;2015年11期
3 李水梅;林月双;卢琼芳;黄睿;;125例住院患者跌倒的Vincent系统回顾分析[J];右江民族医学院学报;2015年05期
4 李勇;;本科机器学习课程教改实践与探索[J];计算机教育;2015年13期
5 王丽娜;胡松;郭佳佳;胡怡;颜贵英;毛拥军;;老年原发性高血压患者超重和肥胖与凝血功能及血小板平均容积相关性研究[J];中华老年心脑血管病杂志;2015年06期
6 刘宁;;一种两层结构集成的协同分类算法[J];微型电脑应用;2015年05期
7 肖爽;赵庆华;;住院患者跌倒相关危险因素的分析研究[J];上海交通大学学报(医学版);2014年12期
8 李勇;;结合欠抽样与集成的软件缺陷预测[J];计算机应用;2014年08期
中国博士学位论文全文数据库 前1条
1 艾轶博;高速列车齿轮箱箱体故障诊断及跨尺度寿命预测研究[D];北京科技大学;2018年
中国硕士学位论文全文数据库 前10条
1 刘小庆;全国基本医疗保险欺诈行为智能监测研究[D];首都经济贸易大学;2018年
2 高聪;基于随机森林的不平衡大数据分类算法研究[D];东北电力大学;2018年
3 张波;基于改进模糊支持向量机算法的语音情感识别研究[D];太原理工大学;2018年
4 周肖肖;基于多模态融合的情感计算研究[D];西安邮电大学;2018年
5 苏晓乐;论女性智能首饰个性化设计[D];延边大学;2018年
6 张耀方;大数据背景下高校资助对象精准认定研究[D];山西财经大学;2018年
7 张菲菲;基于过采样的不平衡数据集成分类算法研究[D];郑州大学;2018年
8 王换;基于过抽样技术的不平衡数据分类研究[D];闽南师范大学;2018年
9 刘天娇;我国中小型上市企业财务危机预警研究[D];华中师范大学;2018年
10 杜国栋;基于梯度提升决策树的患者30天再入院预测模型研究[D];昆明理工大学;2018年
【二级参考文献】
中国期刊全文数据库 前10条
1 孙洁静;刘德平;李华;李辉;张妮;;红细胞分布宽度和白细胞水平与冠心病的关系[J];中华老年医学杂志;2015年03期
2 封顺天;;可穿戴设备发展现状及趋势[J];信息通信技术;2014年03期
3 邹北骥;;大数据分析及其在医疗领域中的应用[J];计算机教育;2014年07期
4 肖少军;王润华;钟晓妮;田考聪;付广建;张燕;彭斌;黄爱龙;;基于关联规则的女性性工作者获取艾滋病知识途径与人口学特征的关系[J];上海交通大学学报(医学版);2013年10期
5 凌颖茹;赵龙;白莉;卢富华;刘旭生;郭新峰;邹川;;基于数据挖掘方法分析黄春林教授治疗肾病综合征用药经验[J];世界科学技术-中医药现代化;2013年05期
6 陶新民;郝思媛;张冬雪;李震;;基于样本特性欠取样的不均衡支持向量机[J];控制与决策;2013年07期
7 赵建华;李伟华;;一种协同半监督分类算法Co-S3OM[J];计算机应用研究;2013年11期
8 夏战国;夏士雄;蔡世玉;万玲;;类不均衡的半监督高斯过程分类算法[J];通信学报;2013年05期
9 冯志仙;黄丽华;胡斌春;;住院患者跌倒造成伤害的风险因素分析[J];中华护理杂志;2013年04期
10 陶新民;郝思媛;张冬雪;徐鹏;;不均衡数据分类算法的综述[J];重庆邮电大学学报(自然科学版);2013年01期
中国博士学位论文全文数据库 前6条
1 计华;Web Spam特征分析及其检测技术研究[D];山东师范大学;2015年
2 杨泽平;基于神经网络的不平衡数据分类方法研究[D];华东理工大学;2015年
3 王瑞;针对类别不平衡和代价敏感分类问题的特征选择和分类算法[D];中国科学技术大学;2013年
4 宋相法;基于稀疏表示和集成学习的若干分类问题研究[D];西安电子科技大学;2013年
5 尹华;面向高维和不平衡数据分类的集成学习研究[D];武汉大学;2012年
6 张春霞;集成学习中有关算法的研究[D];西安交通大学;2010年
中国硕士学位论文全文数据库 前10条
1 吴晓萍;基于LASSO-CD方法的生存分析研究[D];兰州大学;2014年
2 王灿伟;类别不平衡数据的集成分类研究[D];山东师范大学;2012年
3 戴国华;智能安全监控系统在煤矿定位控制中的应用研究[D];湘潭大学;2012年
4 肖练;我国上市公司市值管理分析框架和评价指标研究[D];南京大学;2012年
5 刘晓宇;基于数据挖掘的煤矿瓦斯爆炸危险源预警决策支持系统的研究[D];太原理工大学;2012年
6 李明方;少数类数据识别方法及性能评价[D];山东师范大学;2011年
7 韩秋玲;过抽样算法在不平衡数据学习中的应用[D];华南理工大学;2011年
8 任芳;时间序列数据挖掘研究[D];辽宁师范大学;2010年
9 夏竹青;基于不均衡数据集和决策树的入侵检测分类算法的研究[D];合肥工业大学;2010年
10 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 伊文;;阻塞性睡眠呼吸暂停是发生代谢综合征的危险因素[J];现代医院;2018年11期
2 ;代谢综合征增加肝癌风险[J];柳州医学;2011年02期
3 周群;邢玉珍;杨晓庆;陈露;;武汉市某高校人群代谢综合征的患病率调查分析[J];柳州医学;2010年Z1期
4 小语;123RF;;什么是代谢综合征?[J];健康之家;2018年12期
5 ;吃饭太快或致代谢综合征风险高出5倍[J];中国食品学报;2017年11期
6 郭素娟;马丽;卢义芳;杨敏;张珊珊;沈莎莎;王晓兰;;连云港50岁及以上居民不动行为与代谢综合征发生的关系[J];中国老年学杂志;2017年23期
7 梁愿;李章春;王青;卢薇;钟筑林;刘磊;许小红;张巧;;中老年2型糖尿病代谢综合征与血清分泌型卷曲相关蛋白5水平的关系[J];贵州医药;2018年03期
8 郑仁东;曹琳;刘克冕;刘超;;男性代谢综合征患者性激素结合球蛋白水平的变化[J];江苏医药;2018年05期
9 张建标;吉峰;;非典型抗精神病药物所致代谢综合征防治策略[J];济宁医学院学报;2018年03期
10 付雨;兰丽珍;;代谢综合征患者血清肿瘤坏死因子-α的水平及意义[J];世界最新医学信息文摘;2018年43期
中国重要会议论文全文数据库 前10条
1 宋雅珊;;广西普通人群成人代谢综合征患病率横断面调查[A];2016年中国中西医结合学会肾脏疾病专业委员会学术年会论文摘要汇编[C];2016年
2 徐晓峰;;代谢综合征健康管理的策略[A];2015年浙江省医学会健康管理学分会学术年会暨健康管理学学科与学术发展论坛论文汇编[C];2015年
3 李增英;;代谢综合征的中西医治疗[A];广东省第五届中医、中西医结合防治糖尿病学术大会论文汇编[C];2005年
4 塔其一;王丽新;刘波;沈丽丽;;饮食平衡防患代谢综合征[A];2007全国中医药科普高层论坛文集[C];2007年
5 伍学焱;;雄激素与代谢综合征[A];2009年浙江省男科、泌尿外科学术年会论文汇编[C];2009年
6 金满文;沈纪中;刘毅;刘剑雄;杨蔚芹;李草;胡燕;;五甲基槲皮素对实验性代谢综合征的作用及机制研究[A];中国药理学会第十次全国学术会议专刊[C];2009年
7 聂聪;刘培;;健康评估在企业人群代谢综合征筛查以及后续工作现场健康促进项目中应用研究[A];自主创新与持续增长第十一届中国科协年会论文集(3)[C];2009年
8 李晶华;王桂茹;胡明;张秀敏;;吉林省某省直机关公务员代谢综合征调查及健康管理策略研究[A];自主创新与持续增长第十一届中国科协年会论文集(3)[C];2009年
9 伍佩英;宋晓敏;王爱蓉;庄海萍;董玲;;生活方式与代谢综合征关系的研究[A];膳食变迁对民众健康的影响:挑战与应对——第二届两岸四地营养改善学术会议学术报告及论文摘要汇编[C];2010年
10 孙唯佳;陈敏;陈艳秋;唐倩如;陈爱芳;孙玮;林轶凡;姜菁静;徐丹凤;谢华;孙建琴;;身体活动谱与代谢综合征的关系研究[A];膳食变迁对民众健康的影响:挑战与应对——第二届两岸四地营养改善学术会议学术报告及论文摘要汇编[C];2010年
中国重要报纸全文数据库 前10条
1 通讯员 王雪飞 记者 俞欣;儿童青少年代谢综合征标准出炉[N];健康报;2018年
2 周毅德 山东淄博万杰糖尿病医院;从“诸气愤郁,皆属于肺”论代谢综合征[N];中国中医药报;2015年
3 同济大学附属东方医院糖尿病与减重外科教授 朱江帆;减重手术为何能治代谢综合征[N];健康报;2015年
4 许菊芬;代谢综合征侵扰国人健康[N];市场报;2004年
5 徐亚静;中医药对代谢综合征有整体治疗作用[N];中国医药报;2012年
6 本报记者 王宁 整理;让快乐童年远离代谢综合征[N];中国食品报;2012年
7 芬信;代谢综合征患者死亡率高[N];医药经济报;2002年
8 广文;降压新标准:纠正代谢综合征[N];医药经济报;2003年
9 本报记者 魏赟;代谢综合征,这个“损友”挺面熟[N];医药经济报;2005年
10 记者 高原;散步或能避免患代谢综合征[N];新华每日电讯;2010年
中国博士学位论文全文数据库 前10条
1 周芳;高邮农村疾病调查及动脉硬化与代谢综合征关系的研究[D];南京医科大学;2016年
2 汤楠;寻常型银屑病常见中医证型与代谢综合征及炎症因子的相关性研究[D];广州中医药大学;2017年
3 陈香;糖皮质激素代谢及调节异常与代谢综合征关系的研究[D];四川大学;2005年
4 郭艳英;β_3-AR基因及PPAR-γ_2基因复合变异与新疆哈萨克族人群代谢综合征的关系[D];新疆医科大学;2006年
5 曹剑;性激素、雄激素受体水平与老年男性代谢综合征的相关性研究[D];中国人民解放军军医进修学院;2007年
6 何春燕;散聚法对代谢综合征高危人群脂代谢的作用和机制研究[D];复旦大学;2007年
7 冯琼;代谢综合征的诊断、随访及吡格列酮治疗研究[D];中南大学;2007年
8 陈建鸿;代谢综合征虚、实证型的客观化研究[D];福建中医学院;2007年
9 伍佩英;β-葡聚糖对实验性代谢综合征改善作用及其机制研究[D];第二军医大学;2007年
10 勾忠平;代谢综合征药物治疗的系统评价[D];四川大学;2007年
中国硕士学位论文全文数据库 前10条
1 杨杰;精神分裂症伴代谢综合征的中西医结合治疗[D];华北理工大学;2018年
2 靳利梅;金川职业队列人群代谢综合征患病状况及影响因素研究[D];兰州大学;2013年
3 尚翠华;急性期精神分裂症伴发代谢综合征与瘦素、脂联素等因子的关系[D];华北理工大学;2018年
4 王娟;菊粉对代谢综合征大鼠模型肝脏PI3K通路表达的影响[D];甘肃中医药大学;2018年
5 付雨;太原城市居民代谢综合征与TNF-α水平的相关性分析[D];山西医科大学;2018年
6 胡雅玲;山西太原部分城区人群代谢综合征与骨密度的相关性分析[D];山西医科大学;2018年
7 黄丽帆;浆果对代谢综合征影响的Meta分析[D];重庆医科大学;2018年
8 俞亚滨;探讨代谢综合征对腰椎间盘突出症临床表现及治疗方式的影响[D];南华大学;2018年
9 郭鑫;宜代汤治疗代谢综合征痰瘀互结型的临床疗效观察[D];山西中医药大学;2017年
10 张赛兰;血清胱抑素C在合并代谢综合征的ACS患者中的临床意义[D];广西医科大学;2018年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026