收藏本站
《中国科学技术大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于图和复杂网络理论的蛋白质相互作用数据分析与应用研究

尤著宏  
【摘要】:蛋白质-蛋白质相互作用在生物体的生命活动中扮演着极其重要的作用,几乎涉及到每一个生理过程。高通量实验鉴定技术和计算预测方法的快速发展使得直接和间接来源的大规模蛋白质相互作用数据不断累积。然而,大规模蛋白质相互作用数据中较高比例的假阳性和假阴性“噪声”严重影响了相互作用数据的质量。生物信息学方法能够从已有的数据和知识出发,通过计算的方法系统评估和预测蛋白质相互作用数据的假阳性和假阴性。本文针对上述问题,从蛋白质相互作用网络的拓扑结构出发,以图和复杂网络理论为基本工具,提出了四种有效的计算方法来对蛋白质相互作用数据中假阳性数据进行评估,并预测其假阴性数据和遗传相互作用。最后,我们提出一种在整合蛋白质相互作用数据、高内涵RNAi筛选数据和其它多源数据的基础上重建果蝇的MAPK信号转导通路的方法,以此作为蛋白质相互作用数据的一个应用实例。全文的主要工作概括如下: (1)针对蛋白质相互作用数据中存在着较高比例假阳性数据的问题。提出了一种通过整合与蛋白质相互作用相关的多源异构组学数据,并巧妙地将多源数据信息与蛋白质相互作用网络的拓扑结构信息进行融合,进而过滤蛋白质相互作用数据中的假阳性“噪声”的方法。实验结果表明,所提出过滤算法的性能要优于已有的三种经典方法,能够筛选出原始数据中具有高度可靠性的蛋白质相互作用对。 (2)提出了一种鲁棒的基于流形学习ISOMAP的蛋白质相互作用假阳性过滤和假阴性预测的方法。该方法首先采用ISOMAP方法将原始的蛋白质相互作用网络变换到一个低维的流形空间。然后,根据所嵌入低维空间中蛋白质间的相似性构造了一个用来表示蛋白质对相互作用可能性的可靠性指数。实验结果显示,所提出的方法能够成功地评估或预测稠密或者稀疏蛋白质相互作用网络的假阳性或假阴性“噪声”。 (3)提出了一种新的基于线图和加权网络拓扑结构的方法来消除大规模蛋白质相互作用数据中的假阳性“噪声”。首先,采用一种新颖的加权线图算法将原始的蛋白质相互作用网络变换成其对应的加权线图;然后,计算变换后的加权线图中节点的多种网络拓扑属性。最后,采用一种加权的CD-Dist算法对蛋白质相互作用数据的可靠性进行了评估。实验结果表明,所提出的方法能够取得很好的去噪效果,过滤后的蛋白质相互作用数据可靠性得到了显著的提高。 (4)针对目前在基因组范围内的蛋白质遗传相互作用尚不完全了解,且通过实验的方法检测蛋白质遗传相互作用将非常困难和昂贵这一问题,提出了一种计算系统生物学方法来准确预测合成遗传相互作用。该方法首先通过整合蛋白质相互作用数据、蛋白质复合物数据和基因表达谱数据,构建一个高覆盖率、高精度的功能基因网络。然后,从上述功能基因网络中计算得到十种加权网络拓扑属性作为预测合成遗传相互作用的特征向量。最后,一种基于图的半监督分类器被用来预测合成遗传相互作用。实验结果表明,所提出的方法能够准确地预测酵母的遗传相互作用。 (5)提出了一种将RNA干扰技术、荧光显微镜技术和自动图像分析技术的结合的系统生物学方法来研究果蝇细胞的MAPK信号转导通路。该方法首先通过整合高内涵RNAi筛选数据、多源基因组学和蛋白质组学数据构建一个高可靠性的功能基因网络。然后,采用提出的一种改进的整数线性规划算法从所构建的功能基因网络中重建出果蝇MAPK信号通路。最后,通过p值、基因功能富集分析和已发表文献知识这三个指标来对得到的信号通路的生物显著性进行了验证。实验结果表明,所提出的方法不但能够发现KEGG标准数据库中存放的MAPK信号通路中包括的所有元素,而且还预测了一些额外的参与MAPK信号通路的蛋白质,通过文献查询,这些预测的蛋白质确实参与了MAPK信号通路。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:Q51

【引证文献】
中国硕士学位论文全文数据库 前2条
1 王博;基于频繁功能模式的蛋白质功能预测[D];吉林大学;2012年
2 吴爽;基于群智能机理的PPI网络功能模块聚类[D];陕西师范大学;2012年
【参考文献】
中国期刊全文数据库 前4条
1 谭璐;姜璐;;系统生物学与生物网络研究[J];复杂系统与复杂性科学;2005年04期
2 Limsoon Wong;Guimei Liu;;Protein Interactome Analysis for Countering Pathogen Drug Resistance[J];Journal of Computer Science & Technology;2010年01期
3 孙景春,徐晋麟,李亦学,石铁流;大规模蛋白质相互作用数据的分析与应用[J];科学通报;2005年19期
4 赵静;俞鸿;骆建华;曹志伟;李亦学;;应用复杂网络理论研究代谢网络的进展[J];科学通报;2006年11期
中国博士学位论文全文数据库 前2条
1 史明光;蛋白质相互作用预测方法的研究[D];中国科学技术大学;2009年
2 尹征;基因组尺度高信息量RNA干扰筛选数据分析:一类系统生物学应用中若干模式识别问题的研究[D];浙江大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 文翰;肖南峰;;基于特征分布的半监督分类[J];北京工业大学学报;2012年01期
2 刘光远;董立岩;苑森淼;李永丽;刘辉;;基于位差的属性选择算法[J];吉林大学学报(信息科学版);2007年01期
3 李宏;二分图对集的可扩性[J];成都大学学报(自然科学版);2003年04期
4 于兰芳;;图的矩阵表示及性质[J];承德民族师专学报;2006年02期
5 黄会芸;;图论思想在生活中的运用[J];赤峰学院学报(自然科学版);2009年12期
6 李慧;丁德武;须文波;;计算机科学领域作者合作网络及其分析[J];池州学院学报;2010年06期
7 王兴伟,孙学博,宋波,黄敏;移动无线Internet中的一种组合层次移动管理协议[J];东北大学学报;2005年04期
8 唐晓亮;韩敏;;一种基于极端学习机的半监督学习方法[J];大连理工大学学报;2010年05期
9 姚李孝;任艳楠;费健安;;基于蚁群算法的配电网网络重构[J];电力系统及其自动化学报;2007年06期
10 何尧;张顺淼;;利用未标识文档提高中心分类法性能的研究[J];电脑知识与技术(学术交流);2007年16期
中国重要会议论文全文数据库 前8条
1 赵玲玲;周水生;王雪岩;;基于集成算法的半监督学习[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
2 刘欣;章勇;王娟;;增量学习的TFIDF_NB协同训练分类算法[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
3 ;Sensor Fault Detection and Identification using Kernel PCA and Its Fast Data Reconstruction[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
4 胡扬;;运动分子生物学——21世纪运动生命科学的前沿学科[A];首届中国体育博士高层论坛论文集[C];2006年
5 朱慕华;陈文亮;朱靖波;;词聚类在文本分类中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 石志伟;吴功宜;;改善朴素贝叶斯在文本分类中的稳定性[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
7 陈宁昱;周雅倩;黄萱菁;吴立德;;利用未标注语料改进实体名识别性能[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
8 邹亮;徐峰;任爱珠;;灾害应急设施选址规划研究[A];多元与包容——2012中国城市规划年会论文集(08.城市安全与防灾规划)[C];2012年
中国博士学位论文全文数据库 前10条
1 沈懿珍;基于协同智能的蛋白质相互作用及其网络研究[D];东华大学;2011年
2 李艳文;信号Pathway预测方法研究[D];吉林大学;2011年
3 张小平;主题模型及其在中医临床诊疗中的应用研究[D];北京交通大学;2011年
4 祁瑞华;不完整数据分类知识发现算法研究[D];大连理工大学;2011年
5 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
6 陈文清;基于免疫机理的水泥生产工艺故障智能诊断方法研究[D];华中科技大学;2011年
7 李明;面向计算机辅助诊断的胶囊内镜图像处理与分析技术研究[D];华中科技大学;2011年
8 杜长亮;竞技能力网络结构特征[D];北京体育大学;2011年
9 雷迎科;流形学习算法及其应用研究[D];中国科学技术大学;2011年
10 常啸;生物调控网络的动力学分析[D];上海大学;2011年
中国硕士学位论文全文数据库 前10条
1 张杰;基于支持向量机和蛋白质全序列的蛋白质—蛋白质相互作用预测[D];郑州大学;2010年
2 王芳;基于EVS相似度的邮件社区划分方法研究[D];郑州大学;2010年
3 于帅;基于图切的图像纹理合成与尺寸缩减[D];大连理工大学;2010年
4 王保才;(n,k)-Star图和(n,k)-Arrangement图的反馈数[D];大连理工大学;2010年
5 董学智;广义Kautz有向图GK(d,n)和折叠立方体FQ_n的反馈数[D];大连理工大学;2010年
6 蒋延生;基于图的适应性相似度估算的半监督学习[D];大连理工大学;2010年
7 孔健;基于半监督学习的社团划分算法研究[D];辽宁师范大学;2010年
8 卢加磊;半监督学习中协同训练与多视图方法的比较及改进[D];中国海洋大学;2010年
9 朱莹婷;基于迁移学习理论的Markov检索模型[D];江西师范大学;2010年
10 张庆久;近邻法与多视角学习的理论与算法研究[D];华东师范大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 雷秀娟;黄旭;吴爽;郭玲;;基于连接强度的PPI网络蚁群优化聚类算法[J];电子学报;2012年04期
2 吴超;钟一文;;蛋白质功能预测的蚁群优化算法[J];广西师范大学学报(自然科学版);2011年03期
3 刘白;周永权;;一种基于人工鱼群的混合聚类算法[J];计算机工程与应用;2008年18期
4 周雅兰;;细菌觅食优化算法的研究与应用[J];计算机工程与应用;2010年20期
5 曲良东;何登旭;;一种混沌人工鱼群优化算法[J];计算机工程与应用;2010年22期
6 雷秀娟;田建芳;;蛋白质相互作用网络的蜂群信息流聚类模型与算法[J];计算机学报;2012年01期
7 邹远强;李国徽;赵梓屹;;基于遗传和蚁群算法融合的聚类新方法[J];科学技术与工程;2006年23期
8 孙景春,徐晋麟,李亦学,石铁流;大规模蛋白质相互作用数据的分析与应用[J];科学通报;2005年19期
9 李晓磊,路飞,田国会,钱积新;组合优化问题的人工鱼群算法应用[J];山东大学学报(工学版);2004年05期
10 关薇;王建;贺福初;;大规模蛋白质相互作用研究方法进展[J];生命科学;2006年05期
中国博士学位论文全文数据库 前6条
1 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
2 钟一文;智能优化方法及其应用研究[D];浙江大学;2005年
3 王俊伟;粒子群优化算法的改进及应用[D];东北大学;2006年
4 史明光;蛋白质相互作用预测方法的研究[D];中国科学技术大学;2009年
5 李敏;蛋白质网络中复合物和功能模块挖掘算法研究[D];中南大学;2008年
6 倪青山;蛋白质相互作用与功能预测方法研究[D];国防科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 刘彬彬;大规模蛋白质相互作用网络复合物挖掘算法研究[D];中南大学;2011年
2 刘金洋;粒子群优化算法的研究与改进[D];哈尔滨工业大学;2006年
3 郑晓鸣;人工鱼群算法的改进及应用[D];上海海事大学;2006年
4 李延恩;蛋白质相互作用网络的模块结构辨识[D];华中科技大学;2006年
5 莫春玲;复杂网络中聚类方法及社团结构的研究[D];武汉理工大学;2007年
6 彭利红;基于蛋白质相互作用网络的聚类和稀疏点检测算法研究[D];湖南大学;2008年
7 刘昊;基于聚类算法和相互作用网络的蛋白质功能预测研究[D];湖南大学;2009年
8 彭振文;区间直觉模糊集的聚类算法研究[D];厦门大学;2009年
9 曾海群;蚁群聚类算法研究[D];中南大学;2008年
10 代利坚;蛋白质相互作用预测及其假阳性过滤研究[D];中南大学;2009年
【二级参考文献】
中国期刊全文数据库 前10条
1 张丽苹,霍克克;蛋白质相互作用研究技术进展[J];高技术通讯;2003年11期
2 刘乐平,袁卫;现代贝叶斯分析与现代统计推断[J];经济理论与经济管理;2004年06期
3 方锦清,汪小帆,刘曾荣;略论复杂性问题和非线性复杂网络系统的研究[J];科技导报;2004年02期
4 朱慧明;郝立亚;;非寿险精算中的贝叶斯信用模型分析[J];数量经济技术经济研究;2007年01期
5 梁琳慧,韩忠朝;蛋白质相互作用的研究方法[J];生命的化学;2005年03期
6 王文馨;陈宇光;石铁流;;异源蛋白质相互作用数据整合算法的进展[J];生命科学;2008年05期
7 朱新宇,沈百荣;预测蛋白质间相互作用的生物信息学方法[J];生物技术通讯;2004年01期
8 田云,卢向阳;蛋白质间相互作用研究技术进展[J];生物学通报;2003年05期
9 李霞;刘超;;基于收缩机制的若干回归模型比较研究[J];统计与决策;2008年05期
10 吴金闪,狄增如;从统计物理学看复杂网络研究[J];物理学进展;2004年01期
【相似文献】
中国期刊全文数据库 前10条
1 陈天艳;成军;张树林;;酵母双杂交系统的原理及应用[J];世界华人消化杂志;2003年04期
2 朱新宇,沈百荣;预测蛋白质间相互作用的生物信息学方法[J];生物技术通讯;2004年01期
3 高宁;胡宝成;;酵母双杂交系统的发展及其衍生系统的比较[J];生物技术通讯;2006年03期
4 王丽丽;肖虹;石亚伟;;蛋白质与脂质相互作用的研究技术[J];生命的化学;2006年06期
5 姜茜;贾凌云;;蛋白质相互作用研究的新技术与新方法[J];中国生物化学与分子生物学报;2008年10期
6 吴丽民;刘美龙;刘丽华;;串联亲和纯化(TAP)技术的研究进展[J];海峡药学;2009年01期
7 陆林英;魏雅卓;崔颖;孙平平;马雅楠;马志强;;基于支持向量机的蛋白质相互作用识别[J];生物信息学;2009年04期
8 王斌;王德斌;邱莎;郭庆;申时凯;;融合蛋白辅助筛选系统的设计与实现[J];江苏农业科学;2011年01期
9 唐巍,罗晓艳,Vanessa Samuls;蛋白质相互作用的分析:利用酵母两性杂交系统探索蛋白质功能(英文)[J];Forestry Studies in China;2002年01期
10 ;科学出版社新书推介(2008-11)[J];微生物学报;2009年01期
中国重要会议论文全文数据库 前10条
1 王红阳;;蛋白质相互作用谱研究的思考[A];中国蛋白质组学第二届学术大会论文摘要论文集[C];2004年
2 夏献民;严定国;胡俊波;王桂华;徐戎;曾繁典;;蛋白质相互作用能作为药物研发的靶点吗[A];药学发展前沿论坛及药理学博士论坛论文集[C];2008年
3 许超;张家海;黄小娟;孙建萍;徐应琪;唐雅君;吴季辉;旌蕴逾;黄秋花;张庆华;;核磁共振波谱研究蛋白质相互作用[A];第十四届全国波谱学学术会议论文摘要集[C];2006年
4 郭延芝;余乐正;李梦龙;;利用蛋白质序列信息预测蛋白质相互作用[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
5 杨晓明;王建;许望翔;虞东辉;杨永升;刘琼明;周颖;张翠莉;吴志豪;张万巧;刘涛;唐刘君;原艳芝;郝峰;金超智;贺福初;;人类肝脏重要蛋白质相互作用连锁图研究进展[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
6 张智红;储军;秦岭松;骆清铭;;活细胞内多对蛋白质间相互作用的同步光学成像研究[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
7 李令东;田瑞军;唐伟;邹汉法;赵宗保;;携异戊烯链小分子与蛋白质相互作用的研究[A];第六届全国化学生物学学术会议论文摘要集[C];2009年
8 陈吉楠;张红;Amy E.Keating;蒋太交;;多层次整合思路预测参与酵母囊泡转运的coiled coil介导的蛋白质相互作用[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
9 朱泳璋;李擎天;褚嘉佑;石铁流;郭晓奎;;利用蛋白质相互作用网络系统分析百日咳杆菌相变异[A];2006中国微生物学会第九次全国会员代表大会暨学术年会论文摘要集[C];2006年
10 朱泳璋;李擎天;褚嘉佑;石铁流;郭晓奎;;利用蛋白质相互作用网络系统分析百日咳杆菌相变异[A];上海市预防医学会第二届学术年会论文汇编[C];2006年
中国重要报纸全文数据库 前10条
1 甄蓓;我科学家成功绘制人类肝脏蛋白质相互作用网络连锁图[N];科技日报;2011年
2 胡德荣;蛋白质相互作用网络预测新方法被发现[N];健康报;2007年
3 余志平 编译;PCAs给我们带来了什么?[N];中国医药报;2007年
4 毛黎;美开发细胞内蛋白质相互作用标识技术[N];科技日报;2007年
5 白毅;我国计算生物学研究取得重要进展[N];中国医药报;2007年
6 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
7 潘文;蛋白质组学:新时期寻求新突破[N];中国医药报;2006年
8 记者  张克;北京蛋白质组研究中心与美国AB公司合作[N];科技日报;2006年
9 张杰;散裂中子源是未来科学的新翼[N];科学导报;2006年
10 张佳星;人类为何如此与众不同[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 张万巧;细胞周期调控蛋白质相互作用网络及接头分子TANK募集细胞周期激酶PLK1抑制NF-κB信号通路的机制研究[D];中国人民解放军军事医学科学院;2010年
2 何文英;若干中草药活性组分与几种球状蛋白质相互作用的研究[D];兰州大学;2006年
3 唐江宏;有机小分子与人血清白蛋白的相互作用研究[D];兰州大学;2006年
4 尤著宏;基于图和复杂网络理论的蛋白质相互作用数据分析与应用研究[D];中国科学技术大学;2010年
5 刘月明;人新基因EOLA1生物学特性及相互作用蛋白研究[D];第三军医大学;2004年
6 李非;病毒—宿主蛋白质相互作用网络计算分析关键技术研究[D];国防科学技术大学;2010年
7 刘中扬;蛋白质相互作用网络进化研究[D];中国人民解放军军事医学科学院;2011年
8 沈懿珍;基于协同智能的蛋白质相互作用及其网络研究[D];东华大学;2011年
9 夏俊峰;蛋白质相互作用及其结合面热点残基的预测方法研究[D];中国科学技术大学;2010年
10 陈钢;生物网络分析及其在复杂疾病研究中的应用[D];中南大学;2012年
中国硕士学位论文全文数据库 前10条
1 赵振华;重复基因在分子互作网络中的分歧进化及相互作用网络构建[D];西北农林科技大学;2010年
2 舒小琴;蛋白质相互作用研究方法数据库系统的设计与实现[D];华中科技大学;2006年
3 韩步聪;生物分子相互作用动力学参数数据库及动力学网络的构建[D];厦门大学;2008年
4 施泓;铜绿微囊藻Microcystis aeruginosa PCC 7820基因组文库构建、mazEF基因克隆及其功能的初步研究[D];厦门大学;2008年
5 顾春生;细胞核肌动蛋白与p53蛋白相互作用研究[D];东北师范大学;2007年
6 李满生;基于本体的蛋白质相互作用信息文本挖掘方法研究[D];中国人民解放军军事医学科学院;2010年
7 罗志勇;铜绿微囊藻生物钟蛋白的节律检测及其相互作用蛋白的筛选[D];厦门大学;2007年
8 朱鹏程;水稻蛋白质相互作用网络的生物信息学分析[D];浙江大学;2011年
9 陆林英;基于序列从头预测法的蛋白质相互作用研究[D];东北师范大学;2008年
10 王夏;大肠杆菌O157:H7蛋白质相互作用网络中模块的预测与分析[D];中国人民解放军军事医学科学院;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026