收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于稀疏低秩回归方法的肿瘤亚型聚类分析

葛曙光  
【摘要】:当前,癌症是导致人类死亡的主要疾病之一。随着第二代测序技术的发展,世界各国的学者实施了大规模癌症基因组测序工程(例如TCGA),获得了大量不同类型的生物学数据(例如mRNA表达数据,DNA甲基化数据,体细胞突变数据),对于理解癌症的发病机理,寻找肿瘤的准确亚型,设计出治疗癌症的有效药物等方面产生了积极影响。然而,新的问题也随之而来,如何充分整合和利用多组学的生物测序数据来设计出肿瘤亚型聚类算法,成为生物信息学研究的热点之一。目前,肿瘤亚型聚类常用的分析方法仍是半监督或着无监督的对单一的生物组学数据的样本分配。但这类方法存在的缺陷是多种相关性数据类型不能用于一个单独的聚类方法,容易造成信息损失。近几年来,基于多组学生物数据,研究者提出了一些肿瘤亚型聚类分析算法。但这些方法还处于发展的早期阶段,仍然存在许多问题亟待解决。如基因的预筛选问题、构建真正意义上的数据整合模型、得到更为准确的结果等。因此迫切需要发展新的数据分析方法。本文中,我们研究工作的核心思想是基于稀疏低秩回归的方法,把高维度的多组学数据投射到一个低维度的含有主要的生物过程的子空间里,最终达到数据融合和快速聚类的目的。第一章介绍了基于多组学数据的亚型分析的研究背景、研究意义,以及国内外研究现状和主要的研究方法。第二章介绍了各种研究癌症亚型常用的数据和,列举回顾了多种具有代表性的整合多种数据的聚类算法。第三章介绍了基于稀疏低秩回归方法优化iCluster算法的理论。我们基于稀疏低秩回归的方法代替了优化的PCA的算法,计算出具有稀疏低秩性的系数矩阵的初值,保证了后续迭代过程中估计出最优的后验概率值。与iCluster算法相比的比较实验也验证了算法改进的有效性。第四章介绍了基于稀疏低秩回归的方法提出的Scluster聚类算法的理论。它是用一种用该方法首先利用合适的稀疏低秩回归的方法来从每种生物数据中发现有效的低维度的子空间,然后整合这些子空间为一个样本-样本的相似矩阵,最后用谱聚类的方法识别癌症亚型。对于在三种不同的癌症类型数据集上的实验结果表明,我们提出的Scluster在预测生存周期上更加有效。在GBM的亚型分析中,基于表达数据和甲基化数据的整合,我们的方法能更有效的捕捉到生物上的特征和发现亚型中的子集,发现了一种隐在的新型亚型。第五章介绍了研究中的一些问题并总结全文、展望未来的发展方向。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 黄良;;门限自回归方法在秋季低温发生期预测中的运用[J];四川气象;1991年03期
2 王书宁,戴建设,胡萍;未知有界误差下新的回归方法[J];控制与决策;1994年04期
3 潘蕙琦,史秉璋;介绍一种回归方法──浮动法[J];数理统计与管理;1985年03期
4 倪加勋;介绍一种新的回归方法——单调回归[J];统计与决策;1986年03期
5 颜金锐 ,林群;秩单调回归方法及应用[J];厦门大学学报(哲学社会科学版);1993年03期
6 杨自强;殷溪源;;基于垂直距离的回归方法[J];物探化探计算技术;1993年02期
7 牟永平;怎样用自回归方法 做季降水量预报[J];山东气象;1979年01期
8 孙耀东,王太源,宗序平;可线性化回归方法的改进和拓展[J];扬州大学学报(自然科学版);2001年02期
9 潘蕙琦,史秉璋;用最优回归方法评价一种选择回归子集的新方法[J];数学的实践与认识;1987年02期
10 黄树颜;回归方法的数据预处理及其应用[J];统计研究;1986年02期
11 周宏,谷浩;数据拟合回归方法的探讨[J];财经问题研究;2003年09期
12 徐兮;曾繁祥;;箱梁桥悬臂施工挠度控制的递推回归方法应用[J];数学的实践与认识;2010年16期
13 项可风;关于施肥效果分析问题的评注[J];数学的实践与认识;1993年03期
14 孙耀东,王太源,陶俊;S型曲线的扫描回归方法[J];扬州大学学报(自然科学版);1999年03期
15 陈长松;数据年代序号的编取及其应用[J];山西财经学院学报;1984年02期
16 周云波;余泳泽;;影响我国城镇居民收入差距的主要因素——基于回归方法的分析[J];经济问题探索;2010年12期
17 蒋辉;;在线预测的灰色支持向量回归方法[J];统计与决策;2011年19期
18 王惠文;用PLS回归方法对中国沿海与内陆城市经济的比较分析[J];数理统计与管理;1998年05期
19 徐刚;基于组合数据的回归方法用于成本性态分析[J];技术经济;2002年05期
20 徐伟,朱燕堂;PP回归方法在预测模型中的应用-用PP回归建立“积累”“消费”模型[J];数理统计与管理;1994年02期
中国重要会议论文全文数据库 前2条
1 王莉;杨印生;刘子玉;;基于Binary Logistic回归方法的农村劳动力流动影响因素分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
2 周明;陈中笑;;利用二元回归方法分析我国降水的同位素效应[A];S6 大气成分与天气气候变化[C];2012年
中国博士学位论文全文数据库 前1条
1 勾建伟;惩罚回归方法的研究及其在后全基因关联研究中的应用[D];南京医科大学;2014年
中国硕士学位论文全文数据库 前5条
1 葛曙光;基于稀疏低秩回归方法的肿瘤亚型聚类分析[D];安徽大学;2017年
2 郭月玲;百分位数回归方法在财务管理中的应用[D];电子科技大学;2008年
3 杜万亮;基于独立成分分析的多元回归方法研究[D];东北大学;2009年
4 刘高生;切片逆回归降维模型扩展及其应用[D];贵州财经大学;2014年
5 王晓霞;基于分片逆回归的维数缩减[D];湖北大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978