收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

蛋白质编码序列对蛋白质折叠速率的影响

李瑞芳  
【摘要】:蛋白质折叠问题被列为“21世纪的生物物理学”的重要课题,是分子生物学中心法则尚未解决的一个重大生物学问题。其中重要任务之一便是确定蛋白质折叠速率的决定因素,从而理解蛋白质的折叠机理。目前,人们普遍认为决定蛋白质折叠速率的因素主要来自于构成蛋白质的氨基酸序列和各级结构以及环境和温度。我们认为,除此之外,决定蛋白质折叠速率的信息还来自于蛋白质编码序列,它们在调节蛋白质折叠过程中起到重要作用。本文将探讨编码序列对蛋白质折叠速率的影响。 蛋白质编码序列不仅包含了编码蛋白的遗传语言,还包含了其它丰富的信息内容。这主要表现在密码子的“摆尾”现象,即密码子第三位点碱基使用的自由度问题。同义密码子使用的作用之一是调节编码序列的高级结构,而最普遍的高级结构单元是回文结构。已有研究表明一些特殊分布的回文结构具有非常重要的生物学功能,而且许多疾病与回文结构相关。所以对回文结构的构成进行全面深入的研究,是全面了解核酸序列信息功能的重要方面之一。另外,回文结构在一定程度上反映了mRNA的序列信息和结构信息。若编码序列对蛋白质折叠速率有影响的话,则应该在编码序列的回文结构和同义密码子使用中体现出来。基于这个思路,我们的主要研究内容如下: 1.在蛋白质层面上探究氨基酸片段的平均极性与蛋白质折叠速率的关系。以四种病毒(SARS病毒、艾滋病病毒、丙型肝炎病毒和乙型肝炎病毒)的蛋白质序列以及大肠杆菌60个蛋白酶的所有α螺旋和β折叠片段为研究对象,计算了各片段的折叠速率和平均极性,分别在各物种的α螺旋和β折叠两类二级结构片段中分析了折叠速率和平均极性的相关性。得到结论:不论是病毒蛋白质还是大肠杆菌中的蛋白酶,其中两类氨基酸片段的平均极性与折叠速率都是极显著相关的:对于所有的α片段,二者呈线性正相关;而对于所有的β片段,二者成线性负相关。结果证实了在蛋白质折叠中,氨基酸的极性起着非常重要的作用。 2.编码序列中回文GC含量和回文密度对氨基酸片段平均极性和折叠速率之间关系的影响。定义了蛋白编码序列片段的回文GC含量及回文密度两参量。基于以上四种病毒蛋白质序列的α螺旋片段及β折叠片段的折叠速率与其平均极性之间的相关性,分析了回文GC含量及回文密度对这一相关性的影响。发现这两个参量确实对氨基酸片段折叠速率和平均极性之间的关系有影响。统计分析表明这两个来自编码序列的参量与氨基酸片段的平均极性无显著关系。这间接说明相应编码序列片段的回文GC含量及回文密度影响了蛋白质的折叠速度,且蛋白质折叠速率与回文两参量之间均呈正相关。进一步分析表明影响的根源来自于回文结构的复杂性或可变性和同义密码子的使用偏好,而不是来自于从密码子到氨基酸的翻译信息。这说明蛋白质编码序列确实携带有影响肽链折叠速率乃至蛋白质结构的信息。 3.为了从多个角度印证mRNA结构和序列对蛋白质折叠速率的影响,先选择编码序列的序列参数—GC含量来做初步分析。基于Gromiha给出的13个全β类蛋白质,得到相应编码序列的GC含量并将它加入到Gromiha基于蛋白质序列4个参数的预测折叠速率回归方程中来检验GC含量在蛋白质折叠过程中的作用。与Gromiha的结果比较,预测值和实验值之间的相关系数提高了2%,即从Gromiha的0.96增加到0.98,总体方差从0.50降到0.27,卡方检验值从3.53(p=0.01)降到3.35(p=0.008)。结果表明GC含量对预测蛋白质折叠速率是有效的,意味着蛋白质编码序列的GC含量确实对蛋白质折叠速率有影响。进一步分析也表明这种影响主要来自于密码子的第三位点以及它与第二位点的关联,而不是来自于从密码子到氨基酸的翻译信息。 4.虽然加入编码序列的GC含量后预测蛋白质折叠速率的结果有所改善,但回归方程的Jackknife检验(GC含量参数项的p=0.087)结果表明通常的GC含量并未完全涵盖编码序列中影响蛋白质折叠速率的主要信息。我们分析,出现这样结果是由于编码序列的GC含量不能反映编码序列的结构信息。于是,我们定义了一个既能涵盖序列又能包含序列结构的一个参数,称为回文GC含量。用编码序列中的回文GC含量代替GC含量做同样的分析。与Gromiha的结果比较,蛋白质折叠速率的预测值与实验值之间的相关系数提高了3%,即从Gromiha的0.96增加到0.99,总体方差从0.50降到0.24,卡方检验值从3.53(p=0.01)降到2.86(p=0.004),而且我们新的结果通过了Jackknife检验。这表明蛋白质编码序列中回文GC含量对蛋白质折叠速率有更大的影响。意味着蛋白质编码序列的结构和序列组成是影响蛋白质折叠速率的主要因素。进一步分析也表明这种影响一部分来自于回文结构的复杂性和可变性,另一部分来自于同义密码子的使用或者说是密码子第三位碱基的使用。 5.选择已知折叠速率的18个全α类蛋白,18个全β类蛋白和18个混合类蛋白作为研究对象,直接分析蛋白质折叠速率与相应编码序列中同义密码子的使用之间的相关性。结果发现,对于全α类蛋白,5个密码子的使用与蛋白质的折叠速率显著线性相关;对于全β类蛋白,8个密码子的使用与蛋白质的折叠速率显著线性相关;对于混合类蛋白,4个密码子的使用与蛋白质的折叠速率显著线性相关。而且发现同一个密码子的使用对不同类蛋白质折叠速率的影响是不同的。如谷氨酸Glu,对于全β类和混合类蛋白质,虽然同义密码子GAG和GAA的使用与蛋白质折叠速率都显著相关,但是两个密码子的使用对两类蛋白质折叠速率影响的趋势均是截然相反的。同样,对于精氨酸Arg,同义密码子CGC的使用对全α类和混合类两类蛋白质折叠速率的影响趋势也是相反的。 6.除了GC含量、回文GC含量和同义密码子的使用参量之外,我们又选取了描述遗传语言词汇组成的信息参数D1(一阶信息冗余)、描述遗传语言语法结构的信息参数D2(二阶信息冗余)及其衍生的信息参数X(X=D2/(D1+D2))作为刻画编码序列的特征参数,并基于一个较大的蛋白质数据集分析它们与蛋白质折叠速率之间的线性关系。结果表明,对于二态蛋白质,D2和X这一参量组与全α蛋白和全β蛋白的折叠速率均有极显著的相关性,尤其对于全α蛋白,相关系数达到0.84。而对于多态蛋白,蛋白质编码序列的GC含量这一参量对蛋白质折叠速率的影响较为突出,进一步分析表明对于这种GC含量的影响,其中一部分来自于密码子的第三位点,又一次证实了同义密码子的使用对蛋白质折叠速率的影响。 7.统计分析和比较了艾滋病病毒(HIV-1)、丙型肝炎病毒、SARS病毒及其它几种冠状病毒的回文结构GC含量的特征和分布,发现了其中一些回文结构的特殊分布。综合考虑几种高致病病毒序列的一些特殊回文结构,如在GC含量,回文长度以及位置等方面特殊分布的回文结构,发现这些特殊回文结构往往分布在病毒序列中较为关键的位置。所以,它们一定不只是普通的序列,而应该是具有某种生物功能的重要元件。我们猜想这些特殊回文一定携带一些影响病毒蛋白质功能的重要信息。既然回文结构与蛋白质的功能有非常紧密地联系,而且它们在mRNA序列中有非常广泛的分布。那么,回文结构完全可以作为研究mRNA与蛋白质之间关系的一个很好的参量。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 徐恒;蛋白质折叠的计算机模拟[J];南京大学学报(自然科学版);2004年05期
2 胡红雨;;蛋白质折叠——分子生物学上空的一朵乌云[J];自然杂志;1993年Z3期
3 殷志祥,张家秀;神经网络在蛋白质结构预测中的应用[J];中国科技信息;2005年11期
4 王会峰;;分子伴侣及其在蛋白质折叠中的作用研究进展[J];现代生物医学进展;2009年04期
5 王志新;;Levinthal佯谬到蛋白质结构预测[J];黄石理工学院学报;2006年01期
6 田兴旺;张小华;;分子伴侣与蛋白质折叠的研究进展[J];陕西师范大学继续教育学报;2006年04期
7 李海彦;王吉华;;蛋白质折叠动力学的网络分析[J];生物物理学报;2009年S1期
8 彭晶晶;周烨;;蛋白质折叠的研究与应用进展[J];西安文理学院学报(自然科学版);2011年01期
9 杨正宗;国家攀登计划“新生肽链及蛋白质折叠研究”项目已通过验收[J];生命科学;1997年01期
10 张颖,罗阿蓉;蛋白质折叠结构中所蕴涵的热力学原理[J];陕西师范大学继续教育学报;2005年03期
11 黄启龙;程龙霄;冯佑民;;类胰岛素生长因子-1何以折叠成2种高级结构的分子基础[J];世界科技研究与发展;2007年05期
12 李绍新;张延娇;;基于改进遗传算法的蛋白质三维折叠模拟[J];分析化学;2009年01期
13 李绍新;张延娇;;改进的遗传算法在蛋白质结构预测中的应用[J];华南师范大学学报(自然科学版);2009年01期
14 周圆兀;韩平畴;;基于新杂合进化算法的蛋白质折叠计算[J];生物信息学;2010年01期
15 宋江宁,李炜疆;蛋白质二硫键的分布特征[J];食品与生物技术;2002年05期
16 姜怀春;李宏;;结构基因组学综合数据库分析的构建和作用[J];重庆工商大学学报(自然科学版);2007年04期
17 朱维和;;揭示蛋白质的结构[J];大自然探索;1989年03期
18 张一方;蛋白质折叠的量子引力理论[J];商丘师范学院学报;2005年05期
19 ;利用计算机分析揭示蛋白质折叠规律[J];生命世界;2005年11期
20 王志强;周智敏;郭占云;;蛋白质二硫键异构酶家族的结构与功能[J];生命科学研究;2009年06期
中国重要会议论文全文数据库 前10条
1 李恒;柯慧敏;任国平;叶满萍;翁羽翔;王志珍;;脉冲升温-时间分辨中红外光谱研究蛋白质折叠动力学进展[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
2 李海彦;王吉华;;蛋白质折叠动力学的网络分析[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
3 汪劲 ;张坤 ;吕宏阳 ;汪尔康;;蛋白质折叠的量化动力学路径[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
4 王金凤;;蛋白质折叠和去折叠的核磁共振研究[A];第十一届全国波谱学学术会议论文摘要集[C];2000年
5 刘志荣;;天然无序蛋白质的结构柔性对结合速度的影响[A];第一届全国生物物理化学会议暨生物物理化学发展战略研讨会论文摘要集[C];2010年
6 梁毅;秦志杰;陈杰;周筠梅;;单抗探针探测蛋白质折叠机制的微量热研究[A];第七届全国生物膜学术讨论会论文摘要汇编[C];1999年
7 王志珍;;蛋白质折叠异常或蛋白质折叠错误-蛋白质聚集-构象病[A];中国科协2005年学术年会生物物理与重大疾病分会论文摘要集[C];2005年
8 李慎涛;欧阳红生;张玉静;张锐;廖晓萍;孙博兴;张永亮;;猪肌生成抑制素基因原核表达载体的构建及其表达[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(上册)[C];2001年
9 任民;王志德;张兴伟;刘艳华;牟建民;;基于公共数据库的烟草编码序列SNP位点发掘[A];中国作物学会50周年庆祝会暨2011年学术年会论文集[C];2011年
10 赵同金;欧文斌;刘扬;谢强;周海梦;;蛋白质二硫键异构酶在盐酸胍变性的肌酸激酶再折叠中的作用机制[A];第七届全国酶学学术讨论会论文摘要集[C];2004年
中国博士学位论文全文数据库 前10条
1 李瑞芳;蛋白质编码序列对蛋白质折叠速率的影响[D];内蒙古大学;2011年
2 江学为;蛋白质折叠的网络方法研究[D];华中科技大学;2010年
3 张颖;基于构象量子跃迁的蛋白质折叠速率研究[D];内蒙古大学;2011年
4 周睿;基于联合残基模型的全α和β蛋白质折叠研究[D];华中科技大学;2011年
5 季永运;蛋白质折叠及其误折叠病问题的简单模型研究[D];浙江大学;2006年
6 高建召;基于序列的蛋白质折叠速率与膜蛋白功能分类研究[D];南开大学;2010年
7 齐立省;基于相对熵和复杂网络方法的蛋白质折叠与设计理论研究[D];北京工业大学;2009年
8 常乐;蛋白质的折叠与结合机制研究[D];南京大学;2011年
9 张林森;蛋白质格点模拟与温度适应性[D];中国科学院研究生院(武汉物理与数学研究所);2004年
10 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
中国硕士学位论文全文数据库 前10条
1 孟文茜;两态和单态蛋白质折叠机制的研究[D];大连海事大学;2011年
2 于冲;基于神经网络及序列谱的蛋白质折叠形状码预测[D];吉林大学;2012年
3 严立成;不同类型氨基酸网络参量与蛋白质折叠的关系研究[D];北京工业大学;2010年
4 郭海娟;基于机器学习的蛋白质折叠模式预测研究[D];苏州大学;2010年
5 查娟;基于磁滞优化和极值优化算法的蛋白质折叠问题研究[D];浙江大学;2011年
6 杨林源;基于编码序列、基因间序列和氨基酸序列构建的系统发生关系比较[D];内蒙古大学;2011年
7 刘天龙;DNA编码序列检测的优化算法设计[D];天津大学;2012年
8 付明哲;基于mRNA中嘧啶核苷酸含量影响的蛋白质折叠结构预测[D];陕西科技大学;2012年
9 王若飞;基于机器学习的蛋白质折叠预测算法研究[D];湘潭大学;2010年
10 崔茂林;关于蛋白质折叠构形预测问题的一个PERM改进算法[D];华中科技大学;2004年
中国重要报纸全文数据库 前10条
1 余志平;蛋白质折叠错误 药物研究遇难题[N];中国医药报;2003年
2 记者 杜学敏;王志珍:和时间赛跑的科研人[N];中国妇女报;2007年
3 艳红;阿尔茨海默氏症由蛋白质折叠错误所致?[N];北京科技报;2002年
4 中国科学院生物物理研究所生物大分子国家重点实验室 王志珍;蛋白质的折叠:破译“第二遗传密码”[N];科技日报;2001年
5 阴慧娟;检测用新型生物传感器[N];医药经济报;2007年
6 毛黎;转移核糖核酸结构含有重要进化信息[N];科技日报;2008年
7 蒋志臻;“我从微观世界走上宽阔的参政议政舞台”[N];人民政协报;2005年
8 本报记者  杨明方;恩度,饿死癌细胞[N];人民日报;2006年
9 李山;分子伴侣和异构酶合作机理揭开[N];科技日报;2009年
10 本期执笔 沈强;月饼之喜与闸蟹之忧[N];中国经济导报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978