蛋白质结构预测模型研究
【摘要】:
近20年来,随着生物数据量呈指数级增长,产生了新的交叉学科——生物信息学。而蛋白质结构与功能预测是生物信息学的一项核心研究内容,它的研究不仅能帮助人们了解蛋白质折叠的形成机制,更对实验生物学起着重要的指导作用。
蛋白质结构预测的关键在于建立有效的预测模型并给出合理快速的预测算法,然而蛋白质空间结构复杂,各种结构的形成原因并不完全清楚,因此目前的预测模型和算法都有各自的局限性,预测模型的准确度和算法求解的复杂度之间也互相制约。针对这些问题,本文进行了深入的研究,提出和改进了一些蛋白质结构预测模型及方法。
图论在蛋白质结构预测相关问题的研究中有着重要作用。本文将预测蛋白质二级结构问题转换成求解一个图的最短路径问题,每3个顶点表示序列中的一个氨基酸残基可能形成的二级结构,边表示可能的残基连接,并设计一个函数对边进行赋权,则这个赋权图中的最短路径对应该蛋白质的二级结构。应用这个方法,对几组测试集进行了预测,取得了较好的预测结果,并对模型中环境参数的选取进行了讨论。
蛋白质序列数据的冗余是训练蛋白质结构预测模型需要避免的问题。本文将图论中最大团的概念引入冗余处理的算法中,利用最大团的成熟算法改进了蛋白质数据冗余的处理方法,并对几种蛋白质数据进行了处理,取得比较好的结果。
DNA计算是一种全新的计算模型,本文试图将DNA计算引入到蛋白质结构预测中,建立了蛋白质结构预测的质粒DNA计算模型,为蛋白质结构预测提出一种全新的研究思路。该模型首先将一段待确定空间构型的侧链或主链转换成一个赋权图的顶点,顶点和边根据一些安排好的标准赋权,然后结合最大权团问题的质粒DNA计算模型,建立蛋白质预测问题的DNA计算模型,最后对该质粒DNA计算模型的编码进行了研究,给出了一个编码工具。
概率图模型是蛋白质结构预测的一类有效的模型。本文将20种氨基酸进行分类,通过统计β折叠的典型形成模式,将3-状态隐马尔可夫预测模型扩展为9状态,有效的提高了β折叠的预测精度。条件随机场是最近提出的一种概率图模型,本文构建了一种基于条件随机场的蛋白质结构预测模型,并给出了此类条件随机场的训练及解码算法。同时利用多序列对比程序PSI-BLAST把蛋白质序列转化为表示进化信息的序列模体以提高预测的精度,最后给出预测结果并进行比较分析。
在蛋白质结构预测的研究中,一个重要的问题就是正确预测二硫键的连接,二硫键的准确预测可以减少蛋白质构型的搜索空间,有利于蛋白质的3D结构的预测。本文成功地将LVQ神经网络方法引入蛋白质的二硫键的预测工作中。结果表明蛋白质的二硫键的连接与半胱氨酸的局域序列模式有重要联系,可以由蛋白质的一级结构序列预测该蛋白质的二硫键的连接方式,应用这个方法对蛋白质结构的二硫键进行了预测取得了良好的结果。
HP模型是一种简化的蛋白质结构预测模型,本文对HP模型进行改进,根据氨基酸残基的亲疏水特性以及理化特性将氨基酸残基分为4类,把蛋白质序列简化为一个4元序列,并给出一种通过4元序列能量最低的结构来预测蛋白质的空间结构的简化模型。最后使用一种改进的模拟退火算法对4种不同长度的蛋白质进行二维结构预测,比过去HP模型得到了更小的能量构型,说明该简化模型比HP模型更加精确。同时该方法也可以应用于蛋白质的三维结构预测。
|
|
|
|
1 |
姚志萍,朱德煦,毕汝昌;尿胰蛋白酶抑制剂的空间结构预测[J];科学通报;1996年17期 |
2 |
殷志祥,张家秀;神经网络在蛋白质结构预测中的应用[J];中国科技信息;2005年11期 |
3 |
崔光照,朱永锋,黄布毅,许进;基于联合残基力场的蛋白质能量优化[J];生物信息学;2005年03期 |
4 |
王勇献,王正华,张振慧;蛋白质结构预测算法的评估[J];计算机工程与科学;2005年08期 |
5 |
王志新;;Levinthal佯谬到蛋白质结构预测[J];黄石理工学院学报;2006年01期 |
6 |
孙侠;殷志祥;;蛋白质结构预测的理论方法及阶段[J];生物学杂志;2007年01期 |
7 |
郭雨珍;冯恩民;;蛋白质结构研究现状与展望[J];生物信息学;2007年04期 |
8 |
黄文奇,黄勤波,石赫;预测蛋白质三维结构的拟物算法[J];武汉大学学报(理学版);2004年05期 |
9 |
孙啸;生物信息学——揭示生物分子数据的内涵[J];电子商务;1998年11期 |
10 |
王燕;薛志东;史小红;许进;;广义α转角的预测研究[J];华中科技大学学报(自然科学版);2007年10期 |
11 |
徐建平;方慧生;相秉仁;;一种快速比较蛋白质结构预测模型相似性的方法[J];中国药科大学学报;2006年03期 |
12 |
鲁静;崔波;;人工神经网络在蛋白质结构预测和QSAR中的应用[J];广东化工;2009年11期 |
13 |
张毓敏;章鲁;;一个基于知识的蛋白质结构预测评分函数[J];中国生物医学工程学报;2006年06期 |
14 |
郑婷婷;毛军军;宋杰;程家兴;;蛋白质序列中的多重分形分析[J];计算机工程与应用;2007年20期 |
15 |
刘云玲;陶兰;;蛋白质结构预测方法探析[J];生物信息学;2007年04期 |
16 |
陈红梅;周俊祥;;基于同源建模的蛋白质结构预测方法的研究[J];河南科学;2009年09期 |
17 |
王宝文;王水星;刘文远;于家新;;支持向量机方法预测蛋白质结构中的二硫键[J];生物信息学;2009年04期 |
18 |
王俊;邢丽丽;周鹏;;蛋白质结构预测方法研究[J];黑龙江科技信息;2008年19期 |
19 |
史小红;贾新娟;王燕;;基于Hamilton路模型的蛋白质结构预测的研究[J];数学的实践与认识;2009年22期 |
20 |
黄文奇,黄勤波,石赫;求解蛋白质结构预测问题的二维连续模型及其相应的拟物算法[J];计算机研究与发展;2004年11期 |
|