收藏本站
《华南农业大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于多任务学习模型的癌症基因生存分析研究

李智勇  
【摘要】:生存分析是当今热门的统计学分支,它是分析生存现象和响应时间数据及其规律的一类统计分析方法。生存分析的研究通常是针对所研究的事物建立相应的模型,通过数据特征进行生存时间预测并进行系统的分析,在医学、生物制药、商业与工业等均有广泛的应用。然而在收集临床病例数据时,往往受到删失数据的影响导致许多算法无法使用。而使用如Cox比例风险模型或参数回归模型等模型需要对数据进行一些严格的假设,这种做法破坏了事物原有性质,对实际问题的研究是非常不合适的。为了解决上述两种限制条件,本文使用了一种基于多任务学习模型的癌症基因生存分析方法。此算法是一种归纳迁移学习方法,它可以共享相关任务之间的表征,充分获取删失数据特征中的信息,利用隐含在各特征间的特定领域信息来提高模型的泛化能力,能够更好地概括原始任务,解决了其他生存分析算法无法使用删失数据进行训练的问题。同时,在使用多任务学习时不需要对原问题进行任何额外的假设,针对完整的问题进行建模,大大增加了预测精度。本文的研究重点主要放在如何将生存分析的预测工作转化成使用多任务学习算法来分析建模,提高生存分析的预测性能。研究工作分为以下几个部分:(1)基础技术研究与相关算法考察。本文详细分析了领域内相关算法对删失数据的处理,通过算法分析、搭建模型、实验与分析等步骤系统地分析了不同算法间处理删失数据的差异,为文本的模型的搭建提供了理论依据。(2)基础模型与优化算法选择。本文一个很重要的研究目的是如何充分使用删失数据中的信息来提高模型的预测准确度。使用多任务学习模型作为基础模型能够共享相关任务间的表征,利用隐含的特定领域信息来提高模型的泛化能力。同时还引入了矩阵范数惩罚项与交替方向乘子算法,用于解决模型的过拟合问题。(3)模型的搭建与改进。本文将生存分析中生存时间预测问题转化为经典的二分类回归问题,使用了新的目标函数来解决转化后的回归问题。而解决凸优化问题时引入的交替方向乘子算法进行优化求解。最后对模型的收敛性与时间复杂度进行分析与总结。(4)实验结果分析。本文使用的数据集为几个主流的高维癌症基因表达生存数据集,使用了本文算法与几种常见的生存分析算法进行了实验,并使用C-index值和AUC值作为评价指标,实验最后还对模型的可扩展性进行了验证。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘宏;许燕波;何雪心;;非比例风险模型生存分析方法的选择及应用[J];中国卫生统计;2020年01期
2 李杏;;生存分析的基本方法及其运用[J];华南预防医学;2016年05期
3 ;医生小词典——生存分析[J];临床合理用药杂志;2015年30期
4 井艳梅;冯娜娜;;肿瘤随访资料的生存分析方法[J];健康之路;2016年08期
5 罗胜兰;俞敏;;生存分析的方法及应用[J];浙江预防医学;2013年05期
6 张欣峰;娄清涛;陆建邦;全培良;孙喜斌;;现时生存分析方法的应用实践与评价[J];中国卫生统计;2011年01期
7 梁正东;;三种多元生存分析方法的比较[J];中国卫生统计;1991年02期
8 杨宇;;生存分析[J];中国卫生统计;1989年01期
9 李强;徐刚;陈丽梅;;生存分析的应用误区[J];中国人口科学;2019年01期
10 赵景义;任晓卫;张建军;余红梅;;生存分析SAS和SPSS实现的比较[J];中国卫生统计;2007年03期
11 倪守旗;;生存分析在流行病学随访资料分析中的应用[J];热带病与寄生虫学;1999年04期
12 富振英;生存分析方法[J];药物流行病学杂志;1996年01期
13 方积乾;生存分析与生物医学研究[J];北京医科大学学报;1990年04期
14 方积乾;;多状态生存分析[J];医学研究通讯;1987年07期
15 冯士雍;生存分析(Ⅰ)[J];数学的实践与认识;1982年03期
16 王媛媛;秦刚;汪徐林;张建;何书;沈毅;;GetData Graph Digitizer软件在生存分析中的应用[J];中国卫生统计;2016年02期
17 陈家鼎;生存分析与可靠性学术研讨会在京举行[J];应用概率统计;2001年01期
18 李湘虎,杨房生,缪琦,王晓霞,莫雪莉,李琛,王德林,殷艳萍,麻海虹,冯祥忠;200例原发性支气管肺癌COX模型生存分析[J];北京医学;1999年02期
19 程洪;;生存分析中的最小二乘回归模型[J];中国卫生统计;1991年04期
20 郑祖康;;生存分析的两个问题[J];应用概率统计;1988年02期
中国重要会议论文全文数据库 前10条
1 吴建磊;接智慧;常爽;张萍;王敏;;原发性卵巢非霍奇金淋巴瘤32例临床分析[A];中华医学会第十次全国妇产科学术会议妇科肿瘤会场(妇科肿瘤学组、妇科病理学组)论文汇编[C];2012年
2 黄伟波;王晓敏;刘虹;李燕;;85例慢性淋巴细胞白血病患者生存分析[A];第四届全国血液肿瘤学术大会暨第七届全国淋巴肿瘤诊治进展研讨会论文汇编[C];2014年
3 张啸飞;;前瞻性队列研究及生存分析[A];2014浙江省临床流行病学与循证医学学术年会论文汇编[C];2014年
4 邱忠领;罗全勇;陆汉魁;;~(131)I治疗分化型甲状腺癌骨转移的疗效评价及生存分析[A];中华医学会第九次全国核医学学术会议论文摘要汇编[C];2011年
5 沈文斌;祝淑钗;李娟;苏景伟;王玉祥;刘志坤;;三维适形放射治疗局部晚期非小细胞肺癌长期生存分析[A];中华医学会放射肿瘤治疗学分会六届二次暨中国抗癌协会肿瘤放疗专业委员会二届二次学术会议论文集[C];2009年
6 谢冰斌;张婷;戴春富;;不同侵袭方式的颞骨鳞癌的生存分析[A];中华医学会第十三次全国耳鼻咽喉——头颈外科学术会议论文汇编[C];2013年
7 雷治宇;汤永民;徐晓军;宋华;杨世隆;石淑文;徐卫群;;儿童急性淋巴细胞白血病长期随访及预后分析[A];2013年国家级“恶性血液系统疾病诊治新进展”学习班暨学术年会资料汇编[C];2013年
8 赵海亮;冯彦成;王立芹;;自适应弹性网方法在Cox模型中的应用[A];2017年中国卫生统计学学术年会论文集[C];2017年
9 李博斐;夏云飞;;男性鼻咽癌患者诊断前喝酒与不良预后有关[A];第六届全国鼻咽癌学术大会论文汇编[C];2010年
10 赵志龙;张林;赵惠儒;;含梭形和/或巨细胞成分肺癌17例临床病理分析[A];中华医学会第六次全国胸心血管外科学术会议论文集(胸外科分册)[C];2006年
中国重要报纸全文数据库 前3条
1 复旦大学管理学院统计学系副教授 沈家;生存分析方法在上市公司财务困境研究中的应用[N];上海证券报;2008年
2 记者 张伟超;黄金最终能证明其价值所在[N];中国黄金报;2016年
3 健康时报记者 白轶南 黄小芳;运动有助于癌症治疗[N];健康时报;2012年
中国博士学位论文全文数据库 前10条
1 毛光才;生存分析中若干非参数统计推断问题研究[D];武汉大学;2018年
2 余吉昌;生存分析中有偏抽样和观测研究中因果推断问题的研究[D];武汉大学;2013年
3 赵自强;生存分析中有关特殊设计的若干问题研究[D];复旦大学;2013年
4 环梅;基于生存分析的信号交叉口非机动车穿越行为研究[D];北京交通大学;2014年
5 刘吉彩;生存数据统计模型的变量选择方法[D];华东师范大学;2014年
6 王世勇;恶性神经上皮肿瘤的血管生成拟态及其对患者预后的影响分析[D];南方医科大学;2013年
7 魏自儒;我国新出口市场中企业的进入顺序与出口表现研究[D];清华大学;2013年
8 于水强;水曲柳和落叶松细根寿命的估计[D];东北林业大学;2006年
9 周儒;老年胃癌患者手术治疗风险与疗效评价及巨噬细胞相关集落刺激因子作为新型肿瘤标志物的探索[D];复旦大学;2012年
10 浦飞飞;T细胞免疫球蛋白粘蛋白3在骨肉瘤中的表达及作用研究[D];华中科技大学;2017年
中国硕士学位论文全文数据库 前10条
1 李智勇;基于多任务学习模型的癌症基因生存分析研究[D];华南农业大学;2018年
2 路文馨;基于比例风险模型的生存分析研究[D];华南理工大学;2019年
3 陈达;基于生存分析的P2P借贷平台借款人信用风险评估[D];杭州电子科技大学;2019年
4 闫雪;基于生存分析的网贷项目满标效率影响因素研究[D];哈尔滨工业大学;2019年
5 张梦洁;基于生存分析的公交停靠耗费时间影响因素研究[D];西南交通大学;2019年
6 刘长东;基于统计学习的乳腺癌诊疗延误分析预测研究[D];大连理工大学;2019年
7 梁霖;私人转移支付对我国贫困持续性的影响[D];山东大学;2019年
8 唐静;基于生存分析法的P2P网络借贷平台风险管理研究[D];武汉科技大学;2019年
9 刘畅;基于生存分析的中国ST企业的研究[D];山东大学;2019年
10 郑瑶;EGFR突变晚期NSCLC患者临床特征及生存分析[D];西安医学院;2019年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978