收藏本站
收藏 | 论文排版

结构基因组数据库构建及蛋白质主链构象的计算分析

徐超  
【摘要】: 蛋白质最重要的两类生物大分子之一,是生物体几乎所有活动的承担者,如生化反应的催化酶,呼吸系统中的血红蛋白,免疫系统中的抗体等等。生物体几乎所有的活动都离不开蛋白质。要想在分子水平上解释生命现象离不开对蛋白质结构和功能的研究。多数天然蛋白质在生理条件下都会折叠成稳定的三维空间结构,蛋白质的生物学功能在很大程度上取决于其空间结构,蛋白质结构构象多样性导致了不同的生物学功能。所以蛋白质结构的研究是功能研究和蛋白质设计的基础,也因此越来越得到重视。蛋白质种类繁多,结构千差万别,同时蛋白质结构测定实验是非常费时费力,消耗资源也大,而且成功率有限。为了解决这个矛盾,一方面国际上开展了许多结构基因组计划,试图通过高通量测定蛋白质结构在基因组规模上全面理解蛋白质功能,同时加快结构测定实验的速度,降低单个结构测定的成本。另一方面研究人员一直试图发展计算机模拟的方法来进行蛋白质结构预测,虽然在这方面取得了很大的成绩,但要实现完全解决蛋白质结构预测的目标还需很多的努力。 本论文的工作重点主要是两方面:一是对结构基因组学中靶蛋白筛选和数据管理系统构建的工作,二是对分子动力学中增强采样方法以及小肽中侧链效应和近邻效应的研究。论文共分为以下三个部分: 第1章绪论中简介了蛋白质结构的基础,介绍了目前蛋白质结构测定的常用方法,包括实验测定(X射线晶体衍射法和核磁共振波谱法)和理论预测的方法。理论预测的方法可以分为基于知识的建模预测和基于物理模型的从头预测。基于知识的建模预测又可以按照与已知结构模板的序列相似性可以分为比较建模法、折叠识别法。与实验测定蛋白质结构相比,理论预测的方法具有快速、低成本、高通量的优点,可以作为实验测定的一个有效的补充。本章还简单介绍了结构基因组的内容、优缺点以及当前世界范围内开展这项计划的大致情况。结构基因组计划的主要内容就是大规模、高通量的进行基因组规模上的蛋白质结构测定,因此会产生大量的实验数据,合理的存贮、管理、共享、挖掘这些数据也成为一项艰巨的任务摆在实验人员面前。同时由于实验测定蛋白质结构费时费力,靶蛋白筛选成为提高实验成功率和所测定结构的生物学意义的一个必不可少的环节。绪论最后我们花比较多的篇幅介绍了分子动力学的发展背景和现状,分子动力学作为一种基于物理模型的模拟预测方法除了可以获得蛋白质的结构信息还可以获得很多实验上无法测定的细节信息。分子动力学的基本思路就是用数值方法求解原子运动的牛顿方程或薛定谔方程。但是实际进行模拟时,考虑到体系大小和目前计算机的运算能力,通常都是采用半经验的势能函数,这些势能函数在不同分子力场中虽有差异,但基本上都包含成键相互作用(键长伸缩、键角弯曲、二面角旋转和弯曲)和非键相互作用(静电相互作用、范德华相互作用)项。这种形式的势函数简化了动力学模拟的计算但同时也限制了其准确度。因此发展出很多改进方法,如加入氢键项、极化效应和二面角项修正等。与模拟准确性一样,模拟时间也是制约分子动力学发展的一个主要因素。由于传统的分子动力学模拟的采样符合玻尔兹曼分布,因此要满足各态历经假设需要很长的模拟时间;同时由于体系中快速运动的存在限制了积分步长的大小。延长模拟时间的研究也因此可以分为延长积分步长和加快体系采样。延长积分步长主要是通过消除体系中的快速运动来实现。加快体系采样一是可以采用溶剂模型来减少溶剂分子的计算时间;二是可以采用非玻尔兹曼分布采样来加快构象空间的搜索。增强采样的方法经过20余年的努力目前发展的方法主要包括:高温动力学、放大集合运动方法、构象流动法、加速分子动力学、伞形采样、Tsallis有效势能、温度(哈密顿量)副本交换方法等。 第2章中介绍了为人类CD34(+)造血干细胞/祖细胞及血液系统疾病相关蛋白质的结构基因组学研究进行的前期靶蛋白筛选工作和构建的一套高效的靶蛋白筛选、标注和数据管理的系统。首先介绍了该系统的框架、系统需求和功能。这是一个基于网页交互的数据库系统。通过用户交互的方式、参加结构基因组的不同小组可以方便的添加、修改、共享实验数据和实验方案,同时可以获取生物信息学方法预测的多种信息。其次介绍靶蛋白的结构和功能标注。通过多种生物信息学方法,我们收集整合了蛋白的各种结构和功能标注信息。包括一般信息、物理特性、二级结构、保守区域和潜在功能等。最后介绍结构基因组靶蛋白筛选的过程。筛选过程考虑到实验的可行性和潜在的生物学意义,我们给出了一种筛选的流程,并对筛选得到的1823个靶蛋白按优先级进行了排序。 第3章中介绍了我们独立发展的一种哈密顿副本交换算法和用这种算法进行的残基类型和近邻相互作用的研究。在这种算法中,以丙氨酸二肽主链二面角的自由能曲面经过不同强度变形的伞形势加在各个副本得所有主链二面角上。采用广义的加权直方图分析来计算构象的自由能面的方法利用了所有交换的副本采样,包括加上和未加上附加伞形势的副本,这极大的降低了构象自由能曲面计算的统计不确定性(标准差0.5~1KJ/mol)。我们使用这种基于哈密顿量的副本交换方法研究近邻残基类型和构象对主链中特定二面角的构象平衡的影响,研究的体系包含丙氨酸、苯丙氨酸和颉氨酸的长度为2~5的多肽,模拟中全部采用显式溶剂,研究的焦点是主链二面角分布受自身残基类型以及近邻残基类型和构象的影响。结果不仅反应自身残基类型效应主要为Phe和Val相对Ala更倾向β构象,而且证明了近邻效应与自身残基类型效应大小相当。我们发现N端近邻主要表现出构象效应,各种近邻残基类型的α构象相对于β构象使下游的Ala倾向于β构象。C端近邻正好相反,主要表现出类型效应,C端的Val可以显著的使上游的Ala的构象平衡偏向于PⅡ。结果数据显示了与蛋白质卷曲结构数据库的统计结果具有相当程度的一致性,证明了这种近邻残基的相互作用在小肽和蛋白质中具有普遍性。此外我们还报导了一些在数据库统计中没有反应出的残基类型和近邻效应。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈晨;陈怀楚;高国柱;刘宝林;;基于Oracle数据库的数据审计系统的设计与实现[J];实验技术与管理;2005年12期
2 田蕾;董波;;使用ADO.NET技术轻松访问数据库[J];中国科技信息;2006年01期
3 孙红梅;王萍;贾瑞生;;组件技术在应用型地理信息系统开发中的应用[J];福建电脑;2006年08期
4 龚晓兰;;基于ORACLE信息系统的数据安全保护[J];黑龙江科技信息;2007年08期
5 钟阿林;许方恒;;数据库加密新技术的研究[J];河南师范大学学报(自然科学版);2007年04期
6 杨培芬;闫加海;朱敏嘉;史源香;杜美丽;;山西省气象预报产品数据库系统的开发[J];科技情报开发与经济;2007年36期
7 杜丽君;;预备旅军事信息系统设计与实现[J];科技信息(科学教研);2008年12期
8 钱燕婷;;基于Web Service的中间件技术研究[J];科技信息(学术研究);2008年14期
9 李荣亮;李立甫;陈杰;;基于网络的通指装备维修保障数据库设计[J];黑龙江科技信息;2009年02期
10 孙敏;李宗峰;;医学院校学生成绩管理系统的开发与研究[J];科技资讯;2009年25期
11 刘爱云;;数据库查询优化方法研究[J];河南科技;2010年10期
12 成淼;;浅谈数据库加密技术[J];科技信息;2010年29期
13 王晓静;张晋;;存储子系统调优方法研究[J];辽宁大学学报(自然科学版);2010年04期
14 程惟宁;数据库系统[J];自然杂志;1981年04期
15 杨学孔;数据库系统引论[J];石河子大学学报(自然科学版);1985年01期
16 毋河海;;作为空间信息系统核心的地图数据库系统[J];武汉大学学报(信息科学版);1986年01期
17 牟其铎;;数据库系统的管理与应用概述[J];地震地磁观测与研究;1987年04期
18 彭岩;;日本研制出用于微机的地震资料数据库系统[J];国际地震动态;1987年01期
19 李采华;周先华;;建立工程兵数据库系统初探[J];解放军理工大学学报(自然科学版);1987年04期
20 ;交互式构件几何与力学性质数据库系统ABPS[J];计算力学学报;1988年01期
中国重要会议论文全文数据库 前10条
1 马玉书;李国和;龚平;江伟峰;;用面向对象环境开发知识库/数据库系统[A];第十一届全国数据库学术会议论文集[C];1993年
2 吕新宇;彭成宝;张霞;;移动计算环境下的数据库系统OpenBASE Mini[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
3 张丽;;从IMAGE到ORACLE数据库系统转换工具的设计与实现[A];第十届全国数据库学术会议论文集[C];1992年
4 李敏;费丽娟;胡金柱;;数据库系统中大事务处理问题的研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
5 赵加奎;陈立军;杨冬青;唐世渭;;SQLDBA——基于数据流系统Argus的数据库系统性能实时监控工具[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
6 张霞;郑怀远;;面向对象和语义关联数据库系统的用户友好接口[A];第九届全国数据库学术会议论文集(上)[C];1990年
7 赵莉莉;王引斌;;浅谈数据库系统的发展[A];山西省科技情报学会2004年学术年会论文集[C];2005年
8 张慧斌;袁晓洁;王鑫;汪陈应;刘芳;;XBackend:一种Native XML数据库系统的后端实现策略[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
9 高国弘;郭立新;范彦芳;李香芳;;多类型数据库系统环境下气象信息分布式共享技术研究[A];2011年中国气象学会气象通信与信息技术委员会暨国家气象信息中心科技年会论文摘要[C];2011年
10 王峰;;省级空间信息基础设施数据库建设研究[A];华东六省一市测绘学会第十一次学术交流会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 徐超;结构基因组数据库构建及蛋白质主链构象的计算分析[D];中国科学技术大学;2008年
2 陈建英;基于数字有机体数据库系统的搜索定位研究[D];电子科技大学;2011年
3 史纪安;江河源区生态环境质量评价及数据库研建[D];西北农林科技大学;2006年
4 卢科;闪存数据库系统存储管理及可裁剪性研究[D];中国科学技术大学;2012年
5 韦传宝;一个侵染浙贝母的马铃薯Y病毒属新成员——浙贝母花叶病毒的鉴定[D];浙江大学;2005年
6 相克俊;混合推理高速切削数据库系统的研究与开发[D];山东大学;2007年
7 乌尼尔夫;中国马业综合数据库的建立及马基因组序列预测[D];内蒙古农业大学;2009年
8 赵韩涛;基于GIS-T的高速公路紧急救援系统构建及相关模型研究[D];吉林大学;2006年
9 马利民;新一代产品几何量技术规范(GPS)理论框架体系及关键技术研究[D];华中科技大学;2006年
10 于洋;肝癌中医临床信息数据库系统的构建及应用[D];第二军医大学;2009年
中国硕士学位论文全文数据库 前10条
1 罗朝劲;D-SQL分布式数据库系统的启动与恢复[D];电子科技大学;2002年
2 刘美香;基于COM/DCOM的多数据库系统[D];昆明理工大学;2002年
3 周伟;螺旋桨负载仿真装置[D];哈尔滨工程大学;2006年
4 马宏剑;湛江地区全风化花岗岩路用特性与地理信息系统应用研究[D];东南大学;2006年
5 宫爱红;汽车模具高速切削工艺参数数据库系统的设计[D];华中科技大学;2006年
6 劳越明;数字化服装样板管理系统的研发[D];苏州大学;2007年
7 冯雪莲;基于UML的图书馆网络管理系统的设计与实现[D];天津大学;2007年
8 崔琪;一种新型的信息检索架构:DualEye[D];北京交通大学;2008年
9 叶家炜;平台无关的数据库安全保护方法研究[D];复旦大学;2008年
10 翟艺佳;吉林省生态环境质量评价指标体系及其数据库平台的研建[D];吉林农业大学;2008年
中国重要报纸全文数据库 前10条
1 FN 记者 郑申;让数据提升管理[N];金融时报;2006年
2 周传刚;解读数据库[N];解放军报;2005年
3 记者 孙龙;整合科研信息 提高科研效率[N];中国社会科学院院报;2006年
4 张静静红 李林 陈尚平;用数据库计算税收分析指标[N];中国税务报;2007年
5 驻张家港首席记者 陆晓华;张家港用“数字”管交通[N];苏州日报;2009年
6 ;国家统计局数据库系统建设取得重要进展[N];中国信息报;2002年
7 徐岩;海岸带海岛基础数据库系统建设完成通过验收[N];中国海洋报;2008年
8 李兴衡;IT专业“充电”必备[N];中国电脑教育报;2008年
9 本报记者 田梦;DB2走过25载 数据库未来谁主沉浮[N];计算机世界;2008年
10 杨耀辉;唤醒“沉睡”的信息[N];中国国防报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978