收藏本站
《湘潭大学》 2016年
加入收藏

基于人类蛋白质相互作用网络拓扑相似度的疾病基因预测

胡静波  
【摘要】:疾病基因预测对于实验上发现疾病基因具有重要的指导意义,是高效识别疾病基因的关键。最近,人们借助日臻完善的蛋白质相互作用网络数据,为疾病基因预测找到了一种新的途径。然而,目前所发展的预测算法主要考虑了蛋白质之间的直接相互作用或简单的拓扑特征,忽略了物理和(或)功能模块的因素,以致于预测效果受到限制。本论文从对应功能模块的社团结构出发,分析了人类蛋白质相互作用网络的统计性质与社团结构特征,发现与证实了具有相同或相似疾病表型的致病基因具有功能相关性,并会在蛋白质相互作用网络中形成特定的物理或功能模块,从而定位在同一社团内部。基于这种分析与考虑,我们提出了基于网络拓扑相似度和社团结构相结合的疾病基因预测方法,得到了良好的预测效果,其主要研究结果如下:(1)基于人类蛋白质相互作用网络,采用局部拓扑相似度去实现肝癌基因的预测。交叉检验测试结果表明:各种算法的AUC预测精度均能达到0.7以上,且有22%-29%的目标基因在候选基因中排名前5%。归因于低的计算复杂度和相对高的预测精度,这类疾病基因预测算法可为发现和鉴定疾病基因提供有力的线索。(2)通过对人类蛋白质相互作用网络的社团结构分析,我们首先提出了一个基于社团结构的新相似性指标,并将其与基于路径的相似度有机地结合起来,发展了一种新的预测算法。然后,我们通过对非疾病基因和疾病基因进行了统计分析,证实了基于社团进行疾病预测基因的可行性。最后,我们将算法应用于肝癌疾病基因的预测,并分析了算法的预测性能,特别是详细地讨论了社团结构对预测效果的影响。结果表明,在蛋白质相互作用网络中,与相同或相似疾病有关的基因通常位于相同的社团中,社团结构的引入可有效提升疾病基因的预测精度。
【关键词】:疾病基因预测 蛋白质相互作用网络 拓扑相似度 社团结构
【学位授予单位】:湘潭大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R735.7;Q811.4
【目录】:
  • 摘要4-5
  • Abstract5-9
  • 第1章 概述9-14
  • 1.1 疾病基因预测的研究意义9-10
  • 1.2 疾病基因预测的国内外研究现状及发展动态10-12
  • 1.3 本文工作及论文结构12-14
  • 第2章 人类蛋白质网络的拓扑性质和算法的评价机制14-20
  • 2.1 人类蛋白质网络的拓扑性质14-17
  • 2.1.1 小世界特性14-15
  • 2.1.2 无标度性15-16
  • 2.1.3 功能模块性16-17
  • 2.2 算法的评价机制17-20
  • 2.2.1 ROC曲线17-18
  • 2.2.2 AUC18-19
  • 2.2.3 Precision19-20
  • 第3章 数据整理与分析20-26
  • 3.1 人类蛋白质相互作用网络20-22
  • 3.1.1 蛋白质相互作用的检测技术20-21
  • 3.1.2 人类蛋白质相互作用网络数据21-22
  • 3.1.3 人类蛋白质相互作用与疾病22
  • 3.2 肝癌基因22-26
  • 3.2.1 肝细胞癌22-24
  • 3.2.2 肝癌基因数据24
  • 3.2.3 肝癌基因在蛋白质网络中的拓扑性质24-26
  • 第4章 基于人类蛋白质相互作用网络拓扑相似度的肝癌基因预测26-44
  • 4.1 基于拓扑相似性指标的肝癌基因预测26-31
  • 4.1.1 节点的相似度26-29
  • 4.1.2 结果与分析29-31
  • 4.2 结合路径相似性指标与社团结构的肝癌基因预测31-44
  • 4.2.1 相似性算法的定义31-38
  • 4.2.2 结果与分析38-42
  • 4.2.3 讨论42-44
  • 第5章 总结与展望44-47
  • 5.1 总结44-45
  • 5.2 展望45-47
  • 参考文献47-53
  • 致谢53-54
  • 个人简历、在学期间发表的学术论文与研究成果54

【相似文献】
中国期刊全文数据库 前10条
1 刘建,贺红焰;疾病基因多态性研究是发展个体化临床医学的新途径[J];医学与哲学;2000年05期
2 孙国凤;;日本加强对人疾病基因的研究[J];生物技术通报;1991年04期
3 余关键;捍卫基因的忧虑[J];21世纪;1997年05期
4 ;新世纪十大科技将影响人类生活[J];花炮科技与市场;2001年02期
5 周艳红,周权雄,刘怀兰,万宏辉;基于密码子使用特征预测家族性扩张型心肌病的疾病基因[J];科学通报;2005年20期
6 王一斌;程咏梅;卫泽刚;张绍武;;基于熵聚类和双重筛选策略挖掘动脉粥样硬化风险疾病基因(英文)[J];生物物理学报;2014年01期
7 刘金凤;高磊;刘永宾;李霞;;前馈环中疾病基因的分布特性研究[J];中国优生与遗传杂志;2009年05期
8 ;我国独创疾病基因完整体系[J];海内与海外;2001年02期
9 谢明杰;张磊;蔡榕榕;陈曦;季星来;;人类syndrome疾病基因编码区碱基突变特征分析[J];辽宁师范大学学报(自然科学版);2010年02期
10 邱信芳,俞民澍;医学分子遗传学 第九讲 基因诊断[J];遗传;1990年03期
中国重要会议论文全文数据库 前4条
1 刘维湘;袁克虹;黄勋;唐爱发;贾少微;;疾病基因预选方法综述[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
2 孔令雯;葛正行;;综述COPD疾病基因多态性研究进展[A];2011年贵州省中西医结合学会呼吸专业学术会议论文汇编[C];2011年
3 夏诏杰;王忠;郭力;;构建中风疾病基因关系网络的方法研究[A];中国化学会第28届学术年会第14分会场摘要集[C];2012年
4 程义林;杨森;张学军;;常见复杂疾病表型基因型全基因组关联分析的问题和对策[A];中华医学会第14次全国皮肤性病学术年会论文汇编[C];2008年
中国重要报纸全文数据库 前8条
1 李斌;成都学者研究疾病基因榜上有名[N];成都日报;2007年
2 许铁男;欧洲掀起探索疾病基因热潮[N];医药经济报;2001年
3 记者  尹宁静;易感疾病基因检测进入泰州[N];泰州日报;2006年
4 记者 李天舒;我国将开展五类重大疾病基因研究[N];健康报;2008年
5 霍冬;现代疾病基因新疗法[N];中国高新技术产业导报;2000年
6 本报记者 杨子岩;一匹海外骏马驰骋在喻家山[N];人民日报海外版;2011年
7 刘燕玲;中药与基因功能调控[N];健康报;2003年
8 薛祖玲 王春;上海市自然科学牡丹奖揭晓[N];科技日报;2005年
中国博士学位论文全文数据库 前1条
1 袁芳;基于基因功能信息预测疾病相关基因[D];华中科技大学;2008年
中国硕士学位论文全文数据库 前9条
1 虞佳;基于生物分子网络分析的疾病基因预测算法[D];西安电子科技大学;2014年
2 袁杰;基于模块归一化及自适应跳转随机游走的疾病基因预测[D];华中师范大学;2016年
3 胡静波;基于人类蛋白质相互作用网络拓扑相似度的疾病基因预测[D];湘潭大学;2016年
4 陈颖;基于复杂网络的疾病基因预测的研究[D];东北大学;2009年
5 滕明祥;基于蛋白质互作网络的疾病相关miRNA挖掘方法的研究[D];哈尔滨工业大学;2008年
6 李论;基于氨基酸使用偏好及基因功能信息预测疾病相关基因[D];华中科技大学;2008年
7 周权雄;疾病基因密码子使用特征分析及致病基因预测[D];华中科技大学;2006年
8 李倩;与疾病相关的差异表达基因检测[D];西安电子科技大学;2010年
9 王卉;蛋白质编码基因及遗传疾病相关基因的预测[D];华中科技大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026