收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

从头预测蛋白质结构元启发方法研究

黄旭  
【摘要】:蛋白质因其具有特定结构而成为具体生命功能的执行者。蛋白质结构预测在基因数据高速膨胀,而结构解析成本高、效率低的情况下显得尤为重要。从头预测蛋白质结构不依赖于已知的结构模板,是蛋白质结构预测领域中一项技术难度高、现实意义深远的研究内容。 从计算机的角度来说,蛋白质结构预测本质上是一个组合优化问题,而该项组合优化问题所面临的前所未有的搜索空间与纷繁庞杂的约束机制,是计算机领域的一大挑战。本文在综述蛋白质结构从头预测以及并行元启发相关内容的基础上,着重研究了搜索空间、搜索策略、聚类方案三个方面的内容。主要研究内容包括: 1.结构预测搜索空间研究。研究了骨架预测的片段结构及生成方式,以及侧链旋转异构体的结构及生成方式。在此基础上,针对侧链旋转异构体的生成,提出一种基于动态贝叶斯网络的四层模型。该模型主要有以下两个特点:一是考虑到骨架信息以及侧链4个扭角之间的相互关联及依赖,体现出明确的推理层次,更符合蛋白质分子的生物特性;二是在每一个层次上减少了未知变量个数,降低了模型复杂度,有利于在训练数据集合不变的情况下,缓解数据稀疏现象,提高模型精度。实验表明,该四层模型获得了高质量的结果。此外,还提出一种以极端构象与随机构象评价旋转异构体库的方法,通过在CASP9的FM类数据集上进行实验,验证了方法有效性。 2.并行元启发搜索策略研究。以ACO为例,深入剖析了元启发工作原理,提出以任务分解与经验反馈为基本特点的并行元启发策略。针对从头预测蛋白质结构优化目标难以准确量化、解的构造复杂等问题,提出一种并行元启发搜索框架,融合了不同的能量函数及搜索策略。同时,结合GPCR预测详细设计了任务分配策略。基于ACO机制设计了蛋白质骨架及侧链预测算法。在骨架预测中,详细设计并实现了蚁群内搜索方案、解的构造方法、局部搜索策略以及并行分配机制。最后在Science上一篇文章所采用的16个小蛋白质数据集以及CASP8的FM类数据集上进行了实验,实验结果表明本文的方法具有很强的竞争力。 3.蛋白质结构聚类研究。主要涉及两个方面的研究:一是提出一种用于蛋白质结构聚类的聚类中心选择算法。该方法在深入研究目前常用的蛋白质结构聚类算法――QT算法与AP算法的基础上,着眼于利用统计信息来提高发现最优构象的能力,克服了原有算法受限于具体参数的弊端。二是提出利用能量信息优化结构相似性矩阵的分布特性,提高相似性矩阵对蛋白质天然状态的表现能力,为聚类算法的工作奠定良好基础。最后在两个权威数据集上进行了实验,实验结果表明本文的方法能够针对特定数据集合有效提高聚类性能,从而选择到更加接近天然构象的候选结构。 本文的创新点主要表现在:提出了用于生成侧链旋转异构体库的四层推理模型,该模型充分考虑到骨架与侧链之间的相互关联及依赖关系,并在降低模型复杂度、缓解数据稀疏方面做了合理设计;提出适合蛋白质从头预测的并行元启发方案,在骨架预测中取得了明显效果;提出用于蛋白质结构聚类的聚类中心选择算法以及相似性分布优化方案,提高了搜寻最优构象的准确率。实验表明,这些研究对蛋白质结构从头预测起到了积极的推进作用,对后续相关研究有重要参考价值。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 于波;辛毅;赵春江;吴常信;邓学梅;;黒腹果蝇CG42741基因编码蛋白质结构分析及功能预测[J];中国农业大学学报;2011年04期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前8条
1 吴爱平;田丽青;胡云;曹洋;苗智超;蒋太交;;蛋白质结构预测平台TJ_Jiang及其在CASP8中的表现[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
2 桑延超;彭志红;李谦;;PSO-GA协同优化算法及其在蛋白质结构预测中的应用[A];2007年中国智能自动化会议论文集[C];2007年
3 过涛;孙之荣;;膜蛋白跨膜区段序列分析和预测[A];第七届全国生物膜学术讨论会论文摘要汇编[C];1999年
4 靳利霞;唐焕文;;基于能量极小化的蛋白质结构预测[A];中国运筹学会第六届学术交流会论文集(上卷)[C];2000年
5 胡秀珍;黄延昭;肖奕;;密码子上下文关联与蛋白质结构[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
6 朱永锋;崔光照;;基于构象空间退火算法的蛋白质结构预测[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(上册)[C];2004年
7 王志新;;自然界中究竟有多少种蛋白质折叠类型[A];生命科学与生物技术:中国科协第三届青年学术年会论文集[C];1998年
8 鄒忠毅;韩榕生;李定国;;导引模擬退火法在蛋白质结构分析上的应用[A];Some Problems on the Protein Structure Analyses--Proceedings of CCAST (World Laboratory) Workshop[C];2002年
中国博士学位论文全文数据库 前10条
1 黄旭;从头预测蛋白质结构元启发方法研究[D];苏州大学;2011年
2 罗亮;蛋白质结构预测模型研究[D];华中科技大学;2010年
3 孙鹏飞;基于计算智能技术的蛋白质结构预测方法研究[D];哈尔滨工程大学;2010年
4 靳利霞;蛋白质结构预测方法研究[D];大连理工大学;2002年
5 熊正大;链式几何结构的拟人型优化方法[D];华中科技大学;2011年
6 郭雨珍;蛋白质结构预测和比较的优化研究[D];大连理工大学;2007年
7 谷俊峰;蛋白质结构预测中几个关键问题的研究[D];大连理工大学;2009年
8 欧阳霞辉;拟黑多刺蚁和意大利蜜蜂雌激素相关受体基因的克隆与表达研究[D];陕西师范大学;2007年
9 何洁月;面向蛋白质结构预测的计算生物学技术研究[D];东南大学;2006年
10 刘桂霞;蛋白质关联图预测研究[D];吉林大学;2007年
中国硕士学位论文全文数据库 前10条
1 魏艳宇;蛋白质结构预测中二面角统计势研究[D];华中师范大学;2012年
2 吴进珍;并行蚁群优化在蛋白质结构预测中的应用研究[D];苏州大学;2010年
3 宁静;蛋白质结构预测的多agent模拟退火算法研究[D];福建农林大学;2012年
4 朱均燕;模拟退火算法在蛋白质结构预测中的应用[D];福建农林大学;2011年
5 刘现;蛋白质结构预测的粒子群优化算法研究[D];福建农林大学;2011年
6 范岩;基于监督流形学习算法的固有不规则蛋白质结构预测研究[D];哈尔滨工程大学;2011年
7 邓海游;蛋白质结构预测中基于原子对距离分布的统计势研究[D];华中师范大学;2011年
8 肖衡;基于CUDA的AB非格点蛋白质结构预测的并行化研究[D];武汉科技大学;2011年
9 岳晓辉;基于禁忌搜索算法的蛋白质结构预测的研究[D];大连理工大学;2006年
10 何莲莲;蛋白质结构预测的算法研究[D];武汉大学;2005年
中国重要报纸全文数据库 前7条
1 中国科学院生物物理研究所生物大分子国家重点实验室 王志珍;蛋白质的折叠:破译“第二遗传密码”[N];科技日报;2001年
2 记者 李大庆;我科学家在全球蛋白结构预测比赛中喜获佳绩[N];科技日报;2010年
3 中科院生物学部 张春霆;对生物信息学的展望[N];北京科技报;2000年
4 陈志楠;挖掘“不为人知的艺术”[N];科技日报;2009年
5 王雪飞 吴黎;中国生物信息学研究快速发展[N];健康报;2002年
6 春晓;国外生物信息学的发展与现状[N];中国医药报;2002年
7 本报记者何世文;他们在解密第二遗传密码[N];科技日报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978