收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于序列的蛋白质折叠速率与膜蛋白功能分类研究

高建召  
【摘要】:蛋白质是生命的物质基础。如何理解蛋白质序列,结构和功能三者的关系是生物信息学研究的重要问题。本文致力于研究蛋白质序列和结构,序列和功能之间的关系。本文主要结果由以下四部分组成: 1.提出了一个快速的蛋白质结构比对算法。通过利用蛋白质残基的二面角来代表蛋白质的三维结构,利用动态时间规整(Dynamic Time Warping,DTW)来比对二面角序列。我们证明了在PDB-select数据库中不同蛋白质比对后的得分服从参数为μ=94.7697,(σ=41.5837,ζ=0.1925的广义的极值分布(Generalized Extreme Value Distribution, GEVD)通过该分布还可以计算蛋白质结构比对的结构差异性的统计显著性。该比对得分对蛋白质分类还有很好的应用。和其他结构比对算法如CTSS等相比,我们的算法更具有统计意义和时间效率。 2.蛋白在细胞生命活动中扮演着重要的角色。为了利用序列信息来区分膜蛋白功能,我们提出一种基于快速傅里叶变换特征的机器学习方法对来自膜转运蛋白分类数据库(Transport Classification Database, TCDB)中的三类主要膜转运蛋白进行功能分类。使用快速傅里叶变换(Fast Fourier Transform, FFT)将20种氨基酸的分布,残基的疏水性,平均极性和溶剂化自由能的原始特征数据,转化为频域上的信息作为支持向量机的输入。我们的模型在五倍交叉检验(five-fold cross validation)预测准确率分别达到了72.1%,在相同数据集下,比Gromiha et al等工作的准确率提高了4%。本文的研究证明我们的模型可以有效地对膜转运蛋白的三种主要功能进行分类。 3.提出了两个模型对蛋白质折叠问题进行预测。第一个是基于局部结构信息熵的模型:从AAindex数据库中的531种残基物理化学性质,序列长度信息和局部结构信息熵中筛选特征,分别针对三种折叠机制two-state,multi-state和mixed-state的蛋白质预测其折叠速率,用.Jackknife验证模型真实值与预测值之间的相关系数达到0.790,0.829和0.778。和其他模型相比,我们的模型具有输入参数少,计算简单,平均绝对误差小的优点。另一个是基于序列信息出发,考虑残基的二级结构,残基柔性和溶剂可及性提出一个模型PFR-AF,PFR-AF也是针对三种不同的折叠机制来分别预测三种蛋白质的折叠速率。PFR-AF模型有较高的相关性(0.71到0.95),并且平均绝对误差较小(0.75到0.9),我们的模型还解释了对于two-state折叠的蛋白增加处在蛋白质表面的丙氨酸(Ala)可以加快折叠速率,而增加异亮氨酸(Ile)的含量,则可能降低折叠的速率。我们观还察到coil的柔性可以加快折叠过程,处在蛋白质表面的strands的含量则会降低速率。通过增加处在multi-state蛋白质表面的柔性会延长折叠过程。multi-state蛋白质二级结构starnds的柔性也会减慢折叠过程。另外还提供了两个例证来验证模型的正确性。 4.基因组的开放阅读框(ORF)是基因识别与基因组分析的基础。本文给出了基于终止子的集合p0-MORF定义与它的生成算法,证明了由基因组所确定的P0-MORF集合的存在与唯一性。我们还以原核生物S.Coelicolor A3(2)为例讨论了该生物基因组中CDS与p0-MORF序列的相互关系。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 徐恒;蛋白质折叠的计算机模拟[J];南京大学学报(自然科学版);2004年05期
2 胡红雨;;蛋白质折叠——分子生物学上空的一朵乌云[J];自然杂志;1993年Z3期
3 殷志祥,张家秀;神经网络在蛋白质结构预测中的应用[J];中国科技信息;2005年11期
4 王会峰;;分子伴侣及其在蛋白质折叠中的作用研究进展[J];现代生物医学进展;2009年04期
5 王志新;;Levinthal佯谬到蛋白质结构预测[J];黄石理工学院学报;2006年01期
6 田兴旺;张小华;;分子伴侣与蛋白质折叠的研究进展[J];陕西师范大学继续教育学报;2006年04期
7 李海彦;王吉华;;蛋白质折叠动力学的网络分析[J];生物物理学报;2009年S1期
8 彭晶晶;周烨;;蛋白质折叠的研究与应用进展[J];西安文理学院学报(自然科学版);2011年01期
9 杨正宗;国家攀登计划“新生肽链及蛋白质折叠研究”项目已通过验收[J];生命科学;1997年01期
10 张颖,罗阿蓉;蛋白质折叠结构中所蕴涵的热力学原理[J];陕西师范大学继续教育学报;2005年03期
11 黄启龙;程龙霄;冯佑民;;类胰岛素生长因子-1何以折叠成2种高级结构的分子基础[J];世界科技研究与发展;2007年05期
12 李绍新;张延娇;;基于改进遗传算法的蛋白质三维折叠模拟[J];分析化学;2009年01期
13 李绍新;张延娇;;改进的遗传算法在蛋白质结构预测中的应用[J];华南师范大学学报(自然科学版);2009年01期
14 周圆兀;韩平畴;;基于新杂合进化算法的蛋白质折叠计算[J];生物信息学;2010年01期
15 宋江宁,李炜疆;蛋白质二硫键的分布特征[J];食品与生物技术;2002年05期
16 姜怀春;李宏;;结构基因组学综合数据库分析的构建和作用[J];重庆工商大学学报(自然科学版);2007年04期
17 朱维和;;揭示蛋白质的结构[J];大自然探索;1989年03期
18 张一方;蛋白质折叠的量子引力理论[J];商丘师范学院学报;2005年05期
19 ;利用计算机分析揭示蛋白质折叠规律[J];生命世界;2005年11期
20 王志强;周智敏;郭占云;;蛋白质二硫键异构酶家族的结构与功能[J];生命科学研究;2009年06期
中国重要会议论文全文数据库 前10条
1 李恒;柯慧敏;任国平;叶满萍;翁羽翔;王志珍;;脉冲升温-时间分辨中红外光谱研究蛋白质折叠动力学进展[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
2 李海彦;王吉华;;蛋白质折叠动力学的网络分析[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
3 汪劲 ;张坤 ;吕宏阳 ;汪尔康;;蛋白质折叠的量化动力学路径[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
4 王金凤;;蛋白质折叠和去折叠的核磁共振研究[A];第十一届全国波谱学学术会议论文摘要集[C];2000年
5 刘志荣;;天然无序蛋白质的结构柔性对结合速度的影响[A];第一届全国生物物理化学会议暨生物物理化学发展战略研讨会论文摘要集[C];2010年
6 梁毅;秦志杰;陈杰;周筠梅;;单抗探针探测蛋白质折叠机制的微量热研究[A];第七届全国生物膜学术讨论会论文摘要汇编[C];1999年
7 王志珍;;蛋白质折叠异常或蛋白质折叠错误-蛋白质聚集-构象病[A];中国科协2005年学术年会生物物理与重大疾病分会论文摘要集[C];2005年
8 王建波;杨悦;赵丽丽;张东;唐镇;杨会杰;;汇率序列的可见图分析[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
9 赵同金;欧文斌;刘扬;谢强;周海梦;;蛋白质二硫键异构酶在盐酸胍变性的肌酸激酶再折叠中的作用机制[A];第七届全国酶学学术讨论会论文摘要集[C];2004年
10 高毅勤;;有机共溶剂和空间局限影响水溶液及界面结构的分子动力学研究[A];中国化学会第27届学术年会第14分会场摘要集[C];2010年
中国博士学位论文全文数据库 前10条
1 高建召;基于序列的蛋白质折叠速率与膜蛋白功能分类研究[D];南开大学;2010年
2 江学为;蛋白质折叠的网络方法研究[D];华中科技大学;2010年
3 张颖;基于构象量子跃迁的蛋白质折叠速率研究[D];内蒙古大学;2011年
4 周睿;基于联合残基模型的全α和β蛋白质折叠研究[D];华中科技大学;2011年
5 季永运;蛋白质折叠及其误折叠病问题的简单模型研究[D];浙江大学;2006年
6 李瑞芳;蛋白质编码序列对蛋白质折叠速率的影响[D];内蒙古大学;2011年
7 齐立省;基于相对熵和复杂网络方法的蛋白质折叠与设计理论研究[D];北京工业大学;2009年
8 常乐;蛋白质的折叠与结合机制研究[D];南京大学;2011年
9 张林森;蛋白质格点模拟与温度适应性[D];中国科学院研究生院(武汉物理与数学研究所);2004年
10 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
中国硕士学位论文全文数据库 前10条
1 孟文茜;两态和单态蛋白质折叠机制的研究[D];大连海事大学;2011年
2 于冲;基于神经网络及序列谱的蛋白质折叠形状码预测[D];吉林大学;2012年
3 严立成;不同类型氨基酸网络参量与蛋白质折叠的关系研究[D];北京工业大学;2010年
4 郭海娟;基于机器学习的蛋白质折叠模式预测研究[D];苏州大学;2010年
5 查娟;基于磁滞优化和极值优化算法的蛋白质折叠问题研究[D];浙江大学;2011年
6 胡睿;蛋白质折叠模型的研究[D];西安工业大学;2013年
7 王若飞;基于机器学习的蛋白质折叠预测算法研究[D];湘潭大学;2010年
8 崔茂林;关于蛋白质折叠构形预测问题的一个PERM改进算法[D];华中科技大学;2004年
9 熊茹;基于改进磁滞优化算法的三维蛋白质折叠问题研究[D];浙江大学;2012年
10 毛黎明;分布式并行处理与复杂网络在蛋白质折叠中的应用[D];武汉理工大学;2005年
中国重要报纸全文数据库 前10条
1 余志平;蛋白质折叠错误 药物研究遇难题[N];中国医药报;2003年
2 记者 杜学敏;王志珍:和时间赛跑的科研人[N];中国妇女报;2007年
3 艳红;阿尔茨海默氏症由蛋白质折叠错误所致?[N];北京科技报;2002年
4 中国科学院生物物理研究所生物大分子国家重点实验室 王志珍;蛋白质的折叠:破译“第二遗传密码”[N];科技日报;2001年
5 阴慧娟;检测用新型生物传感器[N];医药经济报;2007年
6 毛黎;转移核糖核酸结构含有重要进化信息[N];科技日报;2008年
7 蒋志臻;“我从微观世界走上宽阔的参政议政舞台”[N];人民政协报;2005年
8 本报记者  杨明方;恩度,饿死癌细胞[N];人民日报;2006年
9 李山;分子伴侣和异构酶合作机理揭开[N];科技日报;2009年
10 本报记者 石勇 实习生 向斌;潘继承:知识就是财富[N];黄石日报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978