收藏本站
《中国科学技术大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

蛋白质相互作用及其结合面热点残基的预测方法研究

夏俊峰  
【摘要】: 随着人类基因组和其它物种基因组序列测定计划的顺利完成,生物学的研究从基因组时代步入后基因组时代。作为后基因组时代的重要研究领域之一的以蛋白质间相互作用研究为中心发展起来的蛋白质组学已经成为当今生命科学研究的热点和前沿领域。研究细胞内所有蛋白质的相互作用即相互作用组,分析各种蛋白质复合物的组成及其作用方式对于我们理解生物体的复杂运行机制至关重要。 在过去的几年时间里,研究人员从计算角度出发,提出了很多的生物信息学方法来研究蛋白质相互作用。在这些方法之中,基于蛋白质序列的预测方法得到了极大的关注。这类方法不需要先验知识,可以广泛地用于蛋白质相互作用的研究之中。同时,蛋白质序列的测定速度远远大于蛋白质结构的实验鉴定速度。因此,利用蛋白质的序列信息来预测蛋白质之间的相互作用是一种非常理想的计算方法。本文从蛋白质序列出发,利用支持向量机和集成学习等机器学习方法来预测蛋白质相互作用。此外,我们还研究了对保持蛋白质的功能和蛋白质复合物结构的稳定性起着关键作用的热点残基。全文的主要工作概括如下: 1.提出了一种基于氨基酸序列自相关描述符与旋转森林的蛋白质相互作用预测方法。自相关描述符刻画了在蛋白质序列上相隔一定距离的两个残基之间的相互作用,因此这种编码方式考虑到了氨基酸的邻域环境,可能会揭示整个序列上与蛋白质相互作用有关的模式。我们首先把氨基酸符号序列转换成理化属性表示的数值序列,然后利用自相关描述符把这些长度不等的蛋白质数值序列转换为一系列长度相同的矢量。最后我们应用旋转森林预测蛋白质相互作用。旋转森林是新近设计出的一种集成学习算法,可以同时提高集成分类器系统中的单分类器准确性和多样性。实验结果表明,我们的方法能够有效地预测蛋白质相互作用,在酵母和幽门螺杆菌数据集上均取得了理想的识别效果。 2.提出了一种基于氨基酸序列分段局部描述符与支持向量机的蛋白质相互作用预测方法。蛋白质相互作用的一个重要特征是相互作用经常发生在序列上的间断区域,在这些区域中,那些序列上相距较远的残基通过蛋白质的折叠从而在空间上相距很近。基于氨基酸序列分段局部描述符考虑到了这种序列上相距较远残基之间的相互作用关系。我们首先将蛋白质序列划分为长度和组成可变的十个局部序列片段,然后再通过局部描述符来编码每一个局部序列片段。所以这种方法可以捕获多个相互重叠的序列上连续和间断的结合模式。在基于这种编码策略的支持向量机预测模型上的实验结果表明我们的方法能有效提高蛋白质相互作用的预测结果。 3.构建了一个元学习方法模型来预测蛋白质相互作用。在我们上述提出的两种特征编码方法基础上,我们又根据相关的研究报道,选择了四种性能良好的编码方法。然后通过这些不同的特征编码方法结合支持向量机建立了六种基于蛋白质序列的相互作用预测单分类器模型。在这些性能优异的单分类器模型基础上,我们构建了基于元学习方法的蛋白质相互作用预测集成学习系统。结果表明元学习方法模型能够使预测性能获得较大的提升。此外,我们的模型在跨物种数据集上也表现出了良好的性能。 4.提出了一种基于氨基酸溶剂可及性和突出指数的相互作用结合面热点残基预测方法。在应用计算方法来研究蛋白质相互作用结合面热点残基时,如何选择有效的生物特征是需要解决的关键问题。我们首先从蛋白质序列和结构出发,提取了一系列与热点残基可能相关的生物特征。然后通过特征选择,构建了九个基于单一特征的支持向量机分类模型。最后,为了进一步提高热点残基预测的精度,我们使用了简单的多数投票表决法来对这九个模型的输出进行了集成决策处理。我们的研究表明氨基酸残基的溶剂可及性和突出指数是热点残基预测中的主要判别特征。在这里,我们是首次应用氨基酸残基的突出指数来对热点残基进行预测。实验结果证实了我们的方法能更加有效地对热点残基进行分类,在预测精度上有着显著性的提高。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:Q51

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 欧阳玉梅;方若森;;蛋白质-蛋白质界面热点残基预测及其在线工具[J];生命科学;2012年01期
中国博士学位论文全文数据库 前1条
1 熊毅;基于机器学习的蛋白质结合位点特征化和预测方法研究[D];武汉大学;2011年
中国硕士学位论文全文数据库 前3条
1 罗慧萍;蛋白质—蛋白质相互作用界面和热点预测的方法研究[D];武汉科技大学;2011年
2 昝金行;几类重要蛋白—蛋白相互作用的分子模拟[D];北京协和医学院;2012年
3 刘诚;蛋白质相互作用界面中热点残基预测方法的研究[D];武汉科技大学;2012年
【参考文献】
中国期刊全文数据库 前3条
1 周鹏;田菲菲;李波;吴世容;李志良;;一种基于遗传算法的肽/蛋白质结合模式虚拟筛选建模技术[J];化学学报;2006年07期
2 王文馨;陈宇光;石铁流;;异源蛋白质相互作用数据整合算法的进展[J];生命科学;2008年05期
3 朱新宇,沈百荣;预测蛋白质间相互作用的生物信息学方法[J];生物技术通讯;2004年01期
中国博士学位论文全文数据库 前3条
1 王兵;蛋白质相互作用及其位点的预测方法研究[D];中国科学技术大学;2006年
2 刘昆宏;多分类器集成系统在基因微阵列数据分析中的应用[D];中国科学技术大学;2008年
3 史明光;蛋白质相互作用预测方法的研究[D];中国科学技术大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 蔡坤琪;;基于相关鉴别分析和随机森林的人脸识别方法[J];安徽电子信息职业技术学院学报;2012年01期
2 王菲露;宋杨;;基于多窗口不同特征的蛋白质相互作用位点预测[J];安徽大学学报(自然科学版);2010年05期
3 潘希姣;;多子群粒子群集成神经网络[J];安徽建筑工业学院学报(自然科学版);2007年02期
4 李亭;杨敬锋;彭晓琴;陈志民;;基于最大似然法集成的黄曲条跳甲预警模型[J];安徽农业科学;2008年25期
5 时雷;虎晓红;席磊;段其国;;集成学习技术在农业中的应用[J];安徽农业科学;2008年26期
6 林正奎;唐焕玲;鲁明羽;王敬东;;基于特征多视图提升Naive Bayesian的Boosting改进算法[J];北京交通大学学报;2009年06期
7 张海;王尧;陈冰;胡荣祖;高红旭;赵凤起;;用Boosting算法预测多硝基芳香族化合物的密度[J];火炸药学报;2007年05期
8 张海;丁毅涛;王尧;胡荣祖;高红旭;赵凤起;;自适应梯度Boosting算法及多硝基芳香族化合物密度的主因子选择[J];火炸药学报;2011年02期
9 李文斌;刘椿年;钟宁;;基于两阶段集成学习的分类器集成[J];北京工业大学学报;2010年03期
10 蒋宗礼;徐学可;;一种基于集成学习与类指示器的文本分类方法[J];北京工业大学学报;2010年04期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 ;Predictive Control Based on Multi-network for a Deep Seabed Mining Robot Vehicle[A];中国自动化学会控制理论专业委员会A卷[C];2011年
3 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年
4 贾少春;胡秀珍;;A Method of Predicting theβ-hairpin Motifs in Proteins[A];第四届全国生物信息学与系统生物学学术大会论文集[C];2010年
5 王中卿;李寿山;朱巧明;李培峰;周国栋;;基于不平衡数据的中文情感分类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 李胜朋;王洪礼;冯剑丰;;基于不连续回归树的最大李雅谱诺夫指数计算方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
7 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
8 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
9 陈华杰;韦巍;;一种基于元泛化的Bagged Boosting算法[A];2005中国控制与决策学术年会论文集(上)[C];2005年
10 张红梅;;基于粗糙集特征约简的SVM集成入侵检测模型[A];2009中国控制与决策会议论文集(3)[C];2009年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 李建平;面向异构数据源的网络安全态势感知模型与方法研究[D];哈尔滨工程大学;2010年
3 邬俊;基于交互式语义推理的图像检索算法研究[D];大连海事大学;2010年
4 李书艳;单点氨基酸多态性与疾病相关关系的预测及其机制研究[D];兰州大学;2010年
5 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
6 尤著宏;基于图和复杂网络理论的蛋白质相互作用数据分析与应用研究[D];中国科学技术大学;2010年
7 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
8 苏煜;基于SCF范式的在线P300脑机接口研究[D];浙江大学;2010年
9 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年
10 甘良志;核学习算法与集成方法研究[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 马冉冉;集成学习算法研究[D];山东科技大学;2010年
2 王萍;语音情感识别研究[D];山东科技大学;2010年
3 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
4 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
5 江达秀;基于HMAX模型的人脸表情识别研究[D];浙江理工大学;2010年
6 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
7 张杰;基于支持向量机和蛋白质全序列的蛋白质—蛋白质相互作用预测[D];郑州大学;2010年
8 陈松峰;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[D];郑州大学;2010年
9 吴正娟;特征变换在组合分类中的应用研究[D];郑州大学;2010年
10 曹彦;基于支持向量机的特征选择及其集成方法的研究[D];郑州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 李娜;;贝叶斯分类器的应用[J];北京工业职业技术学院学报;2008年02期
2 周正荣;宋晓峰;王明浩;;使用组合分类器预测蛋白质相互作用[J];电子学报;2010年06期
3 唐仁泓;龙剑锋;陈百华;;整合素αvβ3、组织因子及血管内皮细胞生长因子在实验性脉络膜新生血管中的表达[J];中南大学学报(医学版);2009年08期
4 魏凯,刘磊,李晓松,郭庆祥;量子力学和分子力学联用方法[J];化学物理学报;2005年05期
5 董秋萍;李涛;熊自忠;;TLR接头蛋白研究进展[J];基础医学与临床;2011年01期
6 马丽;陈桂芬;;基于数据挖掘的决策树算法应用研究[J];农业网络信息;2008年11期
7 乔园园,郭盛;分子模拟软件MOE及其在药物发现中的应用示例[J];计算机与应用化学;2005年02期
8 张春丽;;整合素α_vβ_3受体配体的计算机辅助设计[J];计算机与应用化学;2011年06期
9 张奉学,王新华;蛋白质组学研究及其对中医药发展的启示[J];广州中医药大学学报;2004年06期
10 赵亚雪;唐赟;;蛋白质-蛋白质相互作用及其抑制剂研究进展[J];生命科学;2007年05期
中国博士学位论文全文数据库 前9条
1 常甜甜;支持向量机学习算法若干问题的研究[D];西安电子科技大学;2010年
2 张媛;几类蛋白的结构预测及分子对接的理论研究[D];吉林大学;2005年
3 胡建平;用分子模拟方法研究蛋白质受体与配体的相互作用[D];北京工业大学;2008年
4 战金辉;分子模拟研究几类重要蛋白质与底物的相互作用[D];吉林大学;2009年
5 史明光;蛋白质相互作用预测方法的研究[D];中国科学技术大学;2009年
6 刘融;蛋白质相互作用及其位点的特征分析与预测[D];华中科技大学;2009年
7 张继龙;几类重要蛋白质的分子动力学模拟及相关抑制剂的改良[D];吉林大学;2010年
8 刘鑫;内吗啡肽类似物和阿片肽受体异源二聚化的分子模拟研究[D];兰州大学;2010年
9 倪青山;蛋白质相互作用与功能预测方法研究[D];国防科学技术大学;2009年
中国硕士学位论文全文数据库 前8条
1 张杰;基于支持向量机和蛋白质全序列的蛋白质—蛋白质相互作用预测[D];郑州大学;2010年
2 罗慧萍;蛋白质—蛋白质相互作用界面和热点预测的方法研究[D];武汉科技大学;2011年
3 张艳慧;P-糖蛋白的同源模建及分子对接模拟研究[D];天津大学;2010年
4 刘春莉;用分子模拟方法研究HIV-1整合酶与抑制剂及病毒DNA的相互作用[D];北京工业大学;2005年
5 刘东亮;分子对接方法应用于蛋白质—多肽—蛋白质三体体系研究[D];同济大学;2007年
6 郑明超;数据挖掘技术中分类算法的比较分析[D];兰州商学院;2007年
7 刘清;基于SVM的网络文本分类问题研究与应用[D];南昌大学;2007年
8 徐阳;嗅觉受体的分子模拟及其在中药五味研究中的应用[D];中国协和医科大学;2010年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 刘诚;蛋白质相互作用界面中热点残基预测方法的研究[D];武汉科技大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 张丽苹,霍克克;蛋白质相互作用研究技术进展[J];高技术通讯;2003年11期
2 司英健;蛋白质组学研究的内容、方法及意义[J];国外医学.临床生物化学与检验学分册;2003年03期
3 刘乐平,袁卫;现代贝叶斯分析与现代统计推断[J];经济理论与经济管理;2004年06期
4 ;Rank sum method for related gene selection and its application to tumor diagnosis[J];Chinese Science Bulletin;2004年15期
5 张春霆;生物信息学的现状与展望[J];世界科技研究与发展;2000年06期
6 朱慧明;郝立亚;;非寿险精算中的贝叶斯信用模型分析[J];数量经济技术经济研究;2007年01期
7 梁琳慧,韩忠朝;蛋白质相互作用的研究方法[J];生命的化学;2005年03期
8 王文馨;陈宇光;石铁流;;异源蛋白质相互作用数据整合算法的进展[J];生命科学;2008年05期
9 朱新宇,沈百荣;预测蛋白质间相互作用的生物信息学方法[J];生物技术通讯;2004年01期
10 田云,卢向阳;蛋白质间相互作用研究技术进展[J];生物学通报;2003年05期
中国博士学位论文全文数据库 前1条
1 郑春厚;独立分量分析算法及其应用研究[D];中国科学技术大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 秦殿刚;高松;冯铁男;马成荣;王翼飞;;通过序列编码预测蛋白质相互作用[J];应用科学学报;2009年06期
2 周正荣;宋晓峰;王明浩;;使用组合分类器预测蛋白质相互作用[J];电子学报;2010年06期
3 倪青山;王正志;赵英杰;黎刚果;;基于物理化学性质优化的蛋白质相互作用预测研究[J];生命科学研究;2009年03期
4 朱运松;;蛋白质转移电泳[J];生命的化学;1984年03期
5 陈天艳;成军;张树林;;酵母双杂交系统的原理及应用[J];世界华人消化杂志;2003年04期
6 朱新宇,沈百荣;预测蛋白质间相互作用的生物信息学方法[J];生物技术通讯;2004年01期
7 刘翔;王翼飞;;应用改进的共鸣识别模型预测蛋白质相互作用[J];上海大学学报(自然科学版);2006年01期
8 高宁;胡宝成;;酵母双杂交系统的发展及其衍生系统的比较[J];生物技术通讯;2006年03期
9 王丽丽;肖虹;石亚伟;;蛋白质与脂质相互作用的研究技术[J];生命的化学;2006年06期
10 姜茜;贾凌云;;蛋白质相互作用研究的新技术与新方法[J];中国生物化学与分子生物学报;2008年10期
中国重要会议论文全文数据库 前10条
1 郭延芝;余乐正;李梦龙;;利用蛋白质序列信息预测蛋白质相互作用[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
2 王红阳;;蛋白质相互作用谱研究的思考[A];中国蛋白质组学第二届学术大会论文摘要论文集[C];2004年
3 夏献民;严定国;胡俊波;王桂华;徐戎;曾繁典;;蛋白质相互作用能作为药物研发的靶点吗[A];药学发展前沿论坛及药理学博士论坛论文集[C];2008年
4 许超;张家海;黄小娟;孙建萍;徐应琪;唐雅君;吴季辉;旌蕴逾;黄秋花;张庆华;;核磁共振波谱研究蛋白质相互作用[A];第十四届全国波谱学学术会议论文摘要集[C];2006年
5 杨晓明;王建;许望翔;虞东辉;杨永升;刘琼明;周颖;张翠莉;吴志豪;张万巧;刘涛;唐刘君;原艳芝;郝峰;金超智;贺福初;;人类肝脏重要蛋白质相互作用连锁图研究进展[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
6 张智红;储军;秦岭松;骆清铭;;活细胞内多对蛋白质间相互作用的同步光学成像研究[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
7 李令东;田瑞军;唐伟;邹汉法;赵宗保;;携异戊烯链小分子与蛋白质相互作用的研究[A];第六届全国化学生物学学术会议论文摘要集[C];2009年
8 陈吉楠;张红;Amy E.Keating;蒋太交;;多层次整合思路预测参与酵母囊泡转运的coiled coil介导的蛋白质相互作用[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
9 朱泳璋;李擎天;褚嘉佑;石铁流;郭晓奎;;利用蛋白质相互作用网络系统分析百日咳杆菌相变异[A];2006中国微生物学会第九次全国会员代表大会暨学术年会论文摘要集[C];2006年
10 朱泳璋;李擎天;褚嘉佑;石铁流;郭晓奎;;利用蛋白质相互作用网络系统分析百日咳杆菌相变异[A];上海市预防医学会第二届学术年会论文汇编[C];2006年
中国重要报纸全文数据库 前10条
1 胡德荣;蛋白质相互作用网络预测新方法被发现[N];健康报;2007年
2 甄蓓;我科学家成功绘制人类肝脏蛋白质相互作用网络连锁图[N];科技日报;2011年
3 余志平 编译;PCAs给我们带来了什么?[N];中国医药报;2007年
4 白毅;我国计算生物学研究取得重要进展[N];中国医药报;2007年
5 毛黎;美开发细胞内蛋白质相互作用标识技术[N];科技日报;2007年
6 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
7 潘文;蛋白质组学:新时期寻求新突破[N];中国医药报;2006年
8 宋冬 何玉玺;祖国的需要,就是我们最好的选择[N];科技日报;2009年
9 张杰;散裂中子源是未来科学的新翼[N];科学导报;2006年
10 张佳星;人类为何如此与众不同[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 张万巧;细胞周期调控蛋白质相互作用网络及接头分子TANK募集细胞周期激酶PLK1抑制NF-κB信号通路的机制研究[D];中国人民解放军军事医学科学院;2010年
2 何文英;若干中草药活性组分与几种球状蛋白质相互作用的研究[D];兰州大学;2006年
3 唐江宏;有机小分子与人血清白蛋白的相互作用研究[D];兰州大学;2006年
4 夏俊峰;蛋白质相互作用及其结合面热点残基的预测方法研究[D];中国科学技术大学;2010年
5 杜秀全;基于智能计算的蛋白质相互作用预测方法研究[D];安徽大学;2010年
6 刘月明;人新基因EOLA1生物学特性及相互作用蛋白研究[D];第三军医大学;2004年
7 冯铁男;基于小波的蛋白质相互作用网络的研究[D];上海大学;2011年
8 李非;病毒—宿主蛋白质相互作用网络计算分析关键技术研究[D];国防科学技术大学;2010年
9 尤著宏;基于图和复杂网络理论的蛋白质相互作用数据分析与应用研究[D];中国科学技术大学;2010年
10 刘中扬;蛋白质相互作用网络进化研究[D];中国人民解放军军事医学科学院;2011年
中国硕士学位论文全文数据库 前10条
1 罗慧萍;蛋白质—蛋白质相互作用界面和热点预测的方法研究[D];武汉科技大学;2011年
2 陆林英;基于序列从头预测法的蛋白质相互作用研究[D];东北师范大学;2008年
3 赵振华;重复基因在分子互作网络中的分歧进化及相互作用网络构建[D];西北农林科技大学;2010年
4 舒小琴;蛋白质相互作用研究方法数据库系统的设计与实现[D];华中科技大学;2006年
5 韩步聪;生物分子相互作用动力学参数数据库及动力学网络的构建[D];厦门大学;2008年
6 施泓;铜绿微囊藻Microcystis aeruginosa PCC 7820基因组文库构建、mazEF基因克隆及其功能的初步研究[D];厦门大学;2008年
7 高哲;基于PWMSA算法拟南芥协同基因调控的预测[D];吉林大学;2009年
8 顾春生;细胞核肌动蛋白与p53蛋白相互作用研究[D];东北师范大学;2007年
9 罗志勇;铜绿微囊藻生物钟蛋白的节律检测及其相互作用蛋白的筛选[D];厦门大学;2007年
10 杨磊;蛋白质相互作用预测方法的研究与蛋白质超二级预测系统的开发[D];中国科学技术大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026