收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

蛋白质二级结构的预测以及二级结构与三级结构之间关联的探讨

冯永娥  
【摘要】: 蛋白质的生物功能以其结构为基础。随着人类基因组计划的顺利实施,蛋白质序列信息的积累速度远快于蛋白质结构数量的增长速度。实验上研究蛋白质结构的主要手段有X射线晶体学技术、核磁共振衍射技术、电子纤维技术等。然而,通过实验手段确定蛋白质的结构,不但成本高、耗时,而且实验中还会遇到一些目前无法解决的技术困难,因此人们非常希望利用理论计算的方法直接从序列信息出发来预测蛋白质结构,这是生物信息学研究的重要课题之一。 目前,直接从氨基酸序列信息出发来预测蛋白质三级结构还是有很多困难。更多的焦点集中在去预测蛋白质二级结构。由于二级结构单元是多肽链在三维空间折叠的基本元素,二级结构预测通常作为蛋白质空间结构预测的第一步,是蛋白质三级结构预测中重要的中间步骤,也是蛋白质折叠理论研究的重要挑战。 本文重点介绍了一种新的方法,即基于4肽结构字的多样性增量二次判别法(简称TPIDQD算法),对2个大小不同的数据库进行了二级结构的预测。同时对325个标准样本集合,进行了二级结构和三级结构关联的研究。 (1)新的预测算法大体分三步:首先用定义的三种4肽结构字(alpha、beta、coil)在序列中出现的频次作为多样源,从而建立标准源;然后用多样性增量结合二次判别法对任何一个序列片段中心残基的二级结构进行预测;最后进行一些修正后处理,包括:消除预测中的结构涨落以及用4肽边界字来修正预测后的结构边界。 (2)用TPIDQD算法首次对CB513数据库的二级结构进行了预测,3折交叉检验的预测精度Q_3达到79.19%。 (3)建立了一个新的包括1645个非冗余蛋白质链的数据库,其中蛋白质结构分辨率高于3 Angstroms,序列相似性小于25%。用TPIDQD算法对其中21残基片段中心残基的结构性质进行预测,10折交叉检验得到Q_3为79.68%。当考虑长程序列信息时,即取更长的序列片段(大于21残基长度)来预测时,结果将更好。同时随着字库的扩大,用CB513库作为训练集,对1645蛋白库的交叉检验,也取得了79%的精度。 (4)对325个蛋白的二级结构和其三级结构的关联进行了研究。我们利用广义的二级结构序列信息,定义了两个蛋白之间的距离,和用相似分表示的两个蛋白的三级结构的距离进行了相关性分析。结果发现在排除了长度的依赖性后,在灵敏度α=0.05和α=0.01上,有300个相关系数是高于阈值的。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 朱伟,史定华,王翼飞;神经网络在蛋白质二级结构预测中的应用[J];自然杂志;2003年03期
2 王龙会,石峰;遗传神经网络及其在蛋白质二级结构预测中的应用[J];数学杂志;2002年02期
3 方慧生,相秉仁,安登魁;改进Madaline学习算法预测蛋白质二级结构[J];中国药科大学学报;1996年06期
4 孙海军,阮晓钢;用多模神经网络预测蛋白质二级结构[J];昆明理工大学学报(理工版);2004年05期
5 董启文,王晓龙,林磊,关毅,赵健;蛋白质二级结构预测:基于词条的最大熵马尔科夫方法[J];中国科学C辑;2005年01期
6 王宝文;王水星;刘文远;于家新;;结合支持向量机和贝叶斯方法进行蛋白质二级结构预测[J];生物信息学;2010年01期
7 方慧生,相秉仁,安登魁;人工神经网络在蛋白质二级结构预测中的应用[J];中国药科大学学报;1996年05期
8 杨国慧,周春光,胡成全,于哲舟;一种改进的Bayesian网络模型用于蛋白质二级结构预测[J];自然科学进展;2003年06期
9 王化坤;钱伟懿;;神经网络方法在蛋白质结构预测中的研究与应用[J];黑龙江科技信息;2008年04期
10 张燕平;章晶;徐庆鹏;朱远枫;;基于交叉覆盖算法的蛋白质二级结构预测方法[J];电脑知识与技术;2009年01期
11 吴琳琳;徐硕;;基于SVM的蛋白质二级结构预测[J];生物信息学;2010年03期
12 刘明;闫蓬勃;刘建国;;使预测准确度更高的496蛋白质数据训练集[J];科技信息(学术研究);2007年34期
13 解筱;杨波;陈月辉;;基于神经网络的蛋白质二级结构预测[J];济南大学学报(自然科学版);2008年02期
14 石鸥燕;杨惠云;杨晶;田心;;应用ANN/HMM混合模型预测蛋白质二级结构[J];计算机应用研究;2008年12期
15 刘军;马文丽;姚文娟;郑文岭;;基于神经网络集成的蛋白质二级结构预测模型研究[J];安徽农业科学;2009年27期
16 何东明;陈农安;;计算机模式识别技术在蛋白质二级结构预测中的应用[J];生物化学与生物物理进展;1986年06期
17 张海霞,唐焕文,张立震,靳利霞,唐一源;蛋白质二级结构预测方法的评价[J];计算机与应用化学;2003年06期
18 景楠,周春光,夏斌;基于径向基函数蛋白质二级结构预测方法[J];计算机工程与应用;2005年29期
19 须文波;陆克中;;神经网络在蛋白质二级结构预测中的应用[J];生物信息学;2006年01期
20 徐建平;方慧生;相秉仁;;基于常用得分矩阵的神经网络法预测蛋白质的二级结构[J];中国药科大学学报;2006年05期
中国重要会议论文全文数据库 前1条
1 朱尔一;;偏最小二乘变量筛选法建立蛋白质中三联氨基酸数与二级结构数的模型[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
中国博士学位论文全文数据库 前4条
1 冯永娥;蛋白质二级结构的预测以及二级结构与三级结构之间关联的探讨[D];内蒙古大学;2008年
2 李明辉;基于机器学习的蛋白质二级结构和相互作用预测[D];哈尔滨工业大学;2007年
3 石鸥燕;蛋白质结构预测模型的研究[D];天津医科大学;2008年
4 周圆兀;蛋白质分子自然构象和二级结构的计算分析及预测[D];复旦大学;2008年
中国硕士学位论文全文数据库 前10条
1 于思琦;粗糙集理论在蛋白质结构预测问题应用的研究[D];吉林大学;2005年
2 陈孝卫;数据挖掘技术在蛋白质二级结构预测中的应用研究[D];暨南大学;2005年
3 王洪亮;基于遗传算法的蛋白质二级结构预测研究[D];哈尔滨工程大学;2008年
4 闫化军;计算智能方法在生物信息学中的应用[D];电子科技大学;2005年
5 刘美玲;BA无标度网络模型的应用及扩展[D];武汉理工大学;2005年
6 王比翼;用改进遗传算法和径向基函数网络预测蛋白质二级结构[D];暨南大学;2008年
7 刘文波;基于PBIL算法的蛋白质二级结构预测研究[D];浙江师范大学;2009年
8 何琴;人工神经网络方法在分析化学中的应用研究[D];郑州大学;2005年
9 于莉;基于PBIL算法的蛋白质二级结构预测方法研究[D];国防科学技术大学;2006年
10 桑永胜;基于数据挖掘的生物序列分析研究[D];电子科技大学;2006年
中国重要报纸全文数据库 前1条
1 白毅;加强生物信息学建设推动人类基因组研究[N];中国医药报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978