收藏本站
《湘潭大学》 2016年
加入收藏

基于人类蛋白质相互作用网络拓扑相似度的疾病基因预测

胡静波  
【摘要】:疾病基因预测对于实验上发现疾病基因具有重要的指导意义,是高效识别疾病基因的关键。最近,人们借助日臻完善的蛋白质相互作用网络数据,为疾病基因预测找到了一种新的途径。然而,目前所发展的预测算法主要考虑了蛋白质之间的直接相互作用或简单的拓扑特征,忽略了物理和(或)功能模块的因素,以致于预测效果受到限制。本论文从对应功能模块的社团结构出发,分析了人类蛋白质相互作用网络的统计性质与社团结构特征,发现与证实了具有相同或相似疾病表型的致病基因具有功能相关性,并会在蛋白质相互作用网络中形成特定的物理或功能模块,从而定位在同一社团内部。基于这种分析与考虑,我们提出了基于网络拓扑相似度和社团结构相结合的疾病基因预测方法,得到了良好的预测效果,其主要研究结果如下:(1)基于人类蛋白质相互作用网络,采用局部拓扑相似度去实现肝癌基因的预测。交叉检验测试结果表明:各种算法的AUC预测精度均能达到0.7以上,且有22%-29%的目标基因在候选基因中排名前5%。归因于低的计算复杂度和相对高的预测精度,这类疾病基因预测算法可为发现和鉴定疾病基因提供有力的线索。(2)通过对人类蛋白质相互作用网络的社团结构分析,我们首先提出了一个基于社团结构的新相似性指标,并将其与基于路径的相似度有机地结合起来,发展了一种新的预测算法。然后,我们通过对非疾病基因和疾病基因进行了统计分析,证实了基于社团进行疾病预测基因的可行性。最后,我们将算法应用于肝癌疾病基因的预测,并分析了算法的预测性能,特别是详细地讨论了社团结构对预测效果的影响。结果表明,在蛋白质相互作用网络中,与相同或相似疾病有关的基因通常位于相同的社团中,社团结构的引入可有效提升疾病基因的预测精度。
【关键词】:疾病基因预测 蛋白质相互作用网络 拓扑相似度 社团结构
【学位授予单位】:湘潭大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R735.7;Q811.4
【目录】:
  • 摘要4-5
  • Abstract5-9
  • 第1章 概述9-14
  • 1.1 疾病基因预测的研究意义9-10
  • 1.2 疾病基因预测的国内外研究现状及发展动态10-12
  • 1.3 本文工作及论文结构12-14
  • 第2章 人类蛋白质网络的拓扑性质和算法的评价机制14-20
  • 2.1 人类蛋白质网络的拓扑性质14-17
  • 2.1.1 小世界特性14-15
  • 2.1.2 无标度性15-16
  • 2.1.3 功能模块性16-17
  • 2.2 算法的评价机制17-20
  • 2.2.1 ROC曲线17-18
  • 2.2.2 AUC18-19
  • 2.2.3 Precision19-20
  • 第3章 数据整理与分析20-26
  • 3.1 人类蛋白质相互作用网络20-22
  • 3.1.1 蛋白质相互作用的检测技术20-21
  • 3.1.2 人类蛋白质相互作用网络数据21-22
  • 3.1.3 人类蛋白质相互作用与疾病22
  • 3.2 肝癌基因22-26
  • 3.2.1 肝细胞癌22-24
  • 3.2.2 肝癌基因数据24
  • 3.2.3 肝癌基因在蛋白质网络中的拓扑性质24-26
  • 第4章 基于人类蛋白质相互作用网络拓扑相似度的肝癌基因预测26-44
  • 4.1 基于拓扑相似性指标的肝癌基因预测26-31
  • 4.1.1 节点的相似度26-29
  • 4.1.2 结果与分析29-31
  • 4.2 结合路径相似性指标与社团结构的肝癌基因预测31-44
  • 4.2.1 相似性算法的定义31-38
  • 4.2.2 结果与分析38-42
  • 4.2.3 讨论42-44
  • 第5章 总结与展望44-47
  • 5.1 总结44-45
  • 5.2 展望45-47
  • 参考文献47-53
  • 致谢53-54
  • 个人简历、在学期间发表的学术论文与研究成果54

中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026