收藏本站
《华中师范大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

机器学习算法在医疗数据分析中的应用

叶雷  
【摘要】:近年来,随着信息技术、计算机技术及互联网的快速发展,各个社会领域均积累起了规模庞大的数据。这时候传统的统计分析方法就暴露了它的局限性。如何在这么大规模的数据里面挖掘有用的信息成了各行各业所研究的问题。机器学习是解决数据挖掘问题的主要方法之一。机器学习是一种利用系统本身进行自我改进的过程,使计算机程序能随着经验的积累自动提高性能。虽然现在这些算法还不足以使得机器像人类一样思考,但是在很多领域已经得到了突破性的进展。尤其在医疗数据行业,更是显示了机器学习算法的非常大的优越性。本文主要介绍了四种机器学习算法,分别是k近邻、决策树、支持向量机和随机森林,并将这四种算法应用在慢性肾病的数据上。通过参数的优化建立各自的统计分类模型,然后通过交叉验证比较这四种模型在该数据上的误判率,发现这四种机器学习算法在医疗数据判别上的误判率都很低,其中随机森林的误判率最低为0.0025,所以最后选择最优的随机森林模型对慢性肾病数据进行分析预测。
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP181;R-05

【相似文献】
中国期刊全文数据库 前9条
1 韩玉;施海龙;曲波;武玉欣;刘洁;;随机森林方法在医学中的应用[J];中国预防医学杂志;2014年01期
2 钱维;王超;吴骋;许金芳;叶小飞;杜文民;贺佳;;运用随机森林分析药品不良反应发生的影响因素[J];中国卫生统计;2013年02期
3 武晓岩;李康;;随机森林方法在基因表达数据分析中的应用及研究进展[J];中国卫生统计;2009年04期
4 李贞子;张涛;武晓岩;李康;;随机森林回归分析及在代谢调控关系研究中的应用[J];中国卫生统计;2012年02期
5 刘永春;宋弘;;基于随机森林的乳腺肿瘤诊断研究[J];电视技术;2014年15期
6 聂斌;王卓;杜建强;朱明峰;林剑鸣;艾国平;熊玲珠;;基于粗糙集和随机森林算法辅助糖尿病并发症分类研究[J];江西师范大学学报(自然科学版);2014年03期
7 武晓岩;李康;;基因表达数据判别分析的随机森林方法[J];中国卫生统计;2006年06期
8 武晓岩;闫晓光;李康;;基因表达数据的随机森林逐步判别分析方法[J];中国卫生统计;2007年02期
9 马广立;赵筱萍;程翼宇;;基于随机森林与Chemistry Development Kit描述符的P-gp底物识别[J];高等学校化学学报;2007年10期
中国重要会议论文全文数据库 前7条
1 何晏成;关毅;岳淑珍;;一个基于免疫机制的在线机器学习算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
3 武晓岩;方庆伟;;基因表达数据分析的随机森林方法及算法改进[A];黑龙江省第十次统计科学讨论会论文集[C];2008年
4 张天龙;梁龙;王康;李华;;随机森林结合激光诱导击穿光谱技术用于的钢铁分类[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
5 相玉红;张卓勇;;组蛋白去乙酰化酶抑制剂的构效关系研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
6 张涛;李贞子;武晓岩;李康;;随机森林回归分析方法及在代谢组学中的应用[A];2011年中国卫生统计学年会会议论文集[C];2011年
7 冯飞翔;冯辅周;江鹏程;刘菁;刘建敏;;随机森林和k-近邻法在某型坦克变速箱状态识别中的应用[A];第八届全国转子动力学学术讨论会论文集[C];2008年
中国博士学位论文全文数据库 前6条
1 骈聪;基于机器学习算法的非编码RNA识别[D];南京农业大学;2016年
2 张乾;基于随机森林的视觉数据分类关键技术研究[D];华南理工大学;2016年
3 薛小明;基于时频分析与特征约简的水电机组故障诊断方法研究[D];华中科技大学;2016年
4 曹正凤;随机森林算法优化研究[D];首都经济贸易大学;2014年
5 雷震;随机森林及其在遥感影像处理中应用研究[D];上海交通大学;2012年
6 姚登举;面向医学数据的随机森林特征选择及分类方法研究[D];哈尔滨工程大学;2016年
中国硕士学位论文全文数据库 前10条
1 叶雷;机器学习算法在医疗数据分析中的应用[D];华中师范大学;2017年
2 张春迎;机器学习算法在不同领域数据分析中的应用[D];天津大学;2014年
3 袁方方;基于云平台的机器学习算法并行化研究与应用[D];内蒙古师范大学;2016年
4 贾鑫;面向函数型数据分析的机器学习算法研究与应用[D];北京化工大学;2016年
5 张泽;机器学习算法及其工程应用研究[D];天津大学;2012年
6 班瑞;基于语义Web的机器学习算法研究与应用[D];南京理工大学;2006年
7 张予焓;产品评价对象的提取与分析[D];北京邮电大学;2010年
8 刘永定;基于机器学习算法的P2P流量分类研究[D];湖南工业大学;2009年
9 刘金克;基于机器学习算法的隐喻识别研究[D];南京师范大学;2011年
10 程学新;粒子群优化加权随机森林算法研究[D];郑州大学;2017年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026