比较基因组学的生物信息学分析方法建立及极端嗜酸甲烷氧化细菌V4、大肠杆菌O55:H7菌株CB9615和K-12菌株BW2952及其5株衍生菌株的全基因组破译
【摘要】:基因组学的发展已经经历了近二十年的历史。随着新测序方法的出现,大大加快了基因组测序的步伐。如何处理和分析这些基因组数据成为基因组学研究中的主要困难。
本论文建立的两种全新的生物信息学方法均能够大大加快比较基因组学的工作速度,并且得到更准确的分析结果。以这两个方法为主要工具,结合其他功能基因组和比较基因组学方法,本论文对8个细菌基因组进行了生物信息学分析,并且发现其各自的重要特性。
通过这些方法的建立和研究的进行,我们能够进一步加深对微生物的理解,特别是加深对微生物遗传信息的了解,并且极大促进相关分子生物学的生理生化特性的研究工作。
Ⅰ
随着高通量测序法的发展,基因组的数量急剧膨胀,使比较基因组学成为后基因组时代的研究热点。比较基因组学通过比较全基因组序列来分析生物之间进化关系,遗传差异和潜在表型差异。直系同源基因的寻找是比较基因组学的基础问题,为比较基因组学的后续工作提供基础。直系同源基因寻找程序主要分为基于BLAST的方法和基于进化树重建的方法,但是现有的所有直系同源基因寻找程序都依赖于原有的注释。
本论文选取大肠杆菌种和古菌界的完整基因组序列为研究材料,设计了全新的基于基因与基因组比较的直系同源基因寻找程序。这个程序使用BLAST方法进行基因预测,并使用Inparanoid方法将基因比较为直系同源基因对,最后使用MCL程序将基因对进一步聚类,形成直系同源基因群。
程序突破了直系同源基因寻找依赖于原有注释的瓶颈,在大肠杆菌和古菌中发现了比原来更多的核心基因群,并重建了两个种属的进化树,同时发现在大肠杆菌中有显著的基因消减现象。
Ⅱ
比较基因组学的一个关键问题是对生物的进化关系的重建。分子遗传学中重建进化树的基础是生物DNA或氨基酸序列上的碱基改变。突变是造成这种碱基改变的一个重要原因,突变随着时间经过而发生,从而形成进化中的树状结构;然而,同源重组也是导致碱基改变的一个重要原因。同源重组用一个异源的片段替换基因组的原本片段,从而在短时间内引入大量的碱基改变。重组可以在远源的物种之间发生,从而打乱生物的树状进化结构。这两种造成碱基改变的方式通常难以区分,但是对进化树重建有重要影响。
本论文中引入泊松分布模型来描述随机突变,并通过统计学方式初步区分重组与突变。为了确定重组影响的程度和范围,我们还是用独创的MaxFisher方式对相邻片段间的碱基分布进行区分,进而将基因组区分为重组区和突变区。
使用区分后的突变,可以进行进化树重建,得到更加准确的进化结果。同时,论文中发现,重组不但可以影响进化树的枝长,从而误导进化分子钟的推算,还可以直接影响进化树的拓扑结构,从而使我们无法得到真正的物种亲缘关系。
Ⅲ
极端嗜酸的甲烷氧化细菌Methylacidiphilum inferorum V4可以在极端酸性的地裂环境中降解地壳喷发的甲烷,降低温室气体的排放。极端酸性的地裂环境中每年释放大量的甲烷,然而先前的研究中,使用通用引物无法在酸性环境下发现甲烷氧化细菌。目前已知的甲烷氧化细菌都属于原细菌门,最低生长PH值仅为4.0。
本论文中描述了一个极端嗜酸的甲烷氧化细菌Methylacidiphilum inferorum V4,并使用全基因组测序方法取得了V4的全基因组序列。
与原有的甲烷氧化细菌不同,V4属于疣微菌门,并且可以在2.0-2.5的pH值下生长。本研究在甲烷氧化细菌Methylacidiphilum inferorum V4的基因组中发现了独特的甲烷氧化途径,并分析了V4的核心代谢和其他重要功能途径,并且在全基因组中发现大量的横向转移事件。
Ⅳ
目前已进行的大肠杆菌基因组研究缺乏对具有亲缘关系的克隆之间的详尽遗传改变的研究。大肠杆菌O157:H7是重要的肠出血型致病大肠杆菌,它在世界范围内造成过多次大流行,而与它亲缘关系最近的O55:H7属于另一个致病类型,这两者之间的特性差异是由于基因组上的遗传改变造成。
本论文中完成了对一株O55:H7菌株的全基因组测序,并且将它与两个O157:H7菌株进行基因组学和蛋白质组学水平的比较。本论文对它们之间的包括突变,重组和横向基因转移等大多数遗传差异都进行了定位,并使用同义突变来对它们的分化时间做出了估计。作为参照,我们还研究了3株密切联系的肠外致病大肠杆菌基因组。
O55:H7和O157:H7的主要差别包括一个导致O抗原变换的重组区域。此外,O55:H7中有一个特异的二型分泌系统,而O157:H7中则有更多的三型分泌系统作用因子。他们之间噬菌体也发生了很大的改变。如果使用之前在霍乱弧菌中的进化速率,O55:H7和O157:H7分化时间大约为400年前,如果使用传统分子钟,分化时间大约为14,000到70,000年左右。通过肠外致病大肠杆菌簇的验证,本研究发现大肠杆菌中重组频率比霍乱弧菌中要低。
V
大肠杆菌标准菌株K-12菌株MC4100是最常用的实验室菌株之一。在80年代使用冻干保存之前,K-12菌株在世界各地的实验室中经过了长期的传代过程,其中包括大量记录的和未被记录的遗传改变。这些改变使不同的K-12菌株之间遗传背景出现差异,并导致了全局调控和表型的差异。
本研究对大肠杆菌K-12菌株MC4100进行了全基因组测序,并将其与其它3株已测序的K-12菌株进行比较。在所有已测序K-12菌株内部发现了193个特异的点突变以及许多插入和缺失事件。
通过将这些点突变和插入缺失事件关联,可以解释许多K-12菌株之间的表型差异,然而还有很多点突变的功能未知。这些遗传改变中的大部分都不是人工操作的结果,而是随机的遗传改变。这些变异说明即使在实验室环境中,也需要考虑遗传背景差异带来的潜在实验差异。
Ⅵ
物种进化的多态性是进化中的一个关键问题。传统认为这种多态性是由于环境中复杂的选择压力造成。然而最新的研究证明,即使在单一的选择压力环境下,物种也倾向于通过多种不同的方式适应环境。
本论文通过对大肠杆菌MC4100在同一实验室恒化条件下产生的5个子代进行全基因组测序和蛋白质组学研究,深入解析由磷限制带来的遗传改变,发现细菌通过以rpoS为核心的调控基因的改变来增强对环境的适应能力。
经过一个月左右的进化,MC4100单一菌株的子代出现了显著的分化。进行测序的5个子代通过对不同调控基因的突变改变了自身的环境适应能力。本论文通过这一实验说明细菌在单一选择压力下可以通过不同的调控基因改变来适应环境。
【关键词】:生物信息学 比较基因组学 直系同源 重组 虚拟外参 极端嗜酸甲烷氧化菌 大肠杆菌O55:H7 大肠杆菌O157:H7 分子钟 大肠杆菌K-12MC4100 进化
【学位授予单位】:南开大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:Q78
【目录】:
【学位授予单位】:南开大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:Q78
【目录】:
- 摘要5-9
- Abstract9-13
- 目录13-24
- 第一部分 (Ⅰ)直系同源基因寻找策略24-62
- 第一章 引言25-37
- 第一节 研究背景介绍25-35
- 1.1.1 直系同源预测25-34
- 1.1.1.1 同源性(homology)25-26
- 1.1.1.2 直系同源(orthology)26-27
- 1.1.1.3 旁系同源(paralogy)27
- 1.1.1.4 假直系同源(xenology)27-28
- 1.1.1.5 直系同源的检测困难28-30
- 1.1.1.6 直系同源基因的检测-成对检测30-32
- 1.1.1.7 直系同源基因的检测-进化树拟合32-34
- 1.1.2 基于同源性的基因预测34-35
- 1.1.2.1 同源基因预测34-35
- 1.1.2.2 假基因的注释35
- 第二节 本项工作的研究目标、内容和创新性35-37
- 1.2.1 研究目标35-36
- 1.2.2 研究内容36
- 1.2.3 创新性36-37
- 第二章 材料与方法37-45
- 第一节 实验材料37-40
- 2.1.1 使用的基因组核酸序列和注释信息37-38
- 2.1.2 软件、程序以及数据库38-40
- 第二节 实验方法40-45
- 2.2.1 基于tblastn的基因区预测40-41
- 2.2.2 将潜在同源基因区域与每个基因组的原有注释进行比较41
- 2.2.3 将基因组两两比较,寻找共直系同源群(co-ortholog group)41-43
- 2.2.4 预测新基因以及校正基因起点43
- 2.2.5 通过随机模拟预测核心基因组和旁基因组43
- 2.2.6 融合树和拓扑树的计算43-44
- 2.2.7 基因成分树的计算44-45
- 第三章 实验结果45-59
- 第一节 大肠杆菌中的结果45-56
- 3.1.1 大肠杆菌中的核心基因45-47
- 3.1.2 全基因组进化分析47-52
- 3.1.3 大肠杆菌中的旁基因组52-55
- 3.1.4 对基因预测软件Glimmer 3.0的研究55
- 3.1.5 大肠杆菌中共有的假基因55-56
- 第二节 古菌中的结果56-59
- 3.2.1 古菌中的核心基因56-57
- 3.2.2 古菌中的进化关系57
- 3.2.3 嗜盐古菌57-59
- 第四章 讨论59-61
- 第一节 注释对直系同源比对的影响59-60
- 4.1.1 预测基因过多59
- 4.1.2 预测基因缺失59
- 4.1.3 预测基因起点错误59-60
- 第二节 基因区分离对直系同源比对的影响60
- 第三节 大肠杆菌中的进化关系60-61
- 第五章 结论61-62
- 第二部分 (Ⅱ)重组检测和虚拟外参分析方法62-88
- 第一章 引言63-70
- 第一节 研究背景63-69
- 1.1.1 突变和重组是生物进化的两个主要动力63-65
- 1.1.1.1 突变63
- 1.1.1.2 重组63-65
- 1.1.2 现有的区分重组与突变的方法主要分为基于进化树重建和基于突变分布两种类型65-68
- 1.1.2.1 重组对进化树的两种不同影响65
- 1.1.2.2 基于遗传学分析的重组区划分方式65-66
- 1.1.2.3 基于碱基替换分布的重组区划分方式66
- 1.1.2.4 不同重组区分方式的比较66-68
- 1.1.3 SNP在世系中的分布68-69
- 1.1.3.1 在序列比对中,通过碱基分布情况确定SNP在不同菌株中的分布68
- 1.1.3.2 使用单一外参来定义进化树的根68-69
- 第二节 本工作的研究目标、内容和创新性69-70
- 1.2.1 研究目标69
- 1.2.2 研究内容69
- 1.2.2 创新性69-70
- 第二章 材料与方法70-76
- 第一节 实验材料70-72
- 2.1.1 使用的基因组序列信息70-71
- 2.1.2 软件、程序以及数据库71-72
- 第二节 实验方法72-76
- 2.2.1 基因组比对方法72
- 2.2.2 RecDetect分析方法72-74
- 2.2.3 使用模拟数据检验RecDetect方法74
- 2.2.4 Virtual Outgroup分析方法74-76
- 第三章 结果与分析76-85
- 第一节 RectDetect程序76-83
- 3.1.1 在虚拟数据中的验证结果76-77
- 3.1.2 实例一:蚜虫共生菌的SNP位点的分布77-78
- 3.1.3 实例二:利用RecDetect在霍乱弧菌中划分重组78
- 3.1.4 实例三:大肠杆菌78
- 3.1.5 实例四:不动杆菌78-83
- 第二节 虚拟外参83-85
- 3.2.1 应用虚拟外参到霍乱弧菌83-84
- 3.2.2 应用虚拟外参到大肠杆菌84-85
- 第四章 讨论85-87
- 第一节 区分重组和突变85
- 第二节 使用虚拟外参将SNP定位在世系上85-87
- 第五章 结论87-88
- 第三部分 (Ⅲ)极端嗜酸甲烷氧化菌Methylacidiphilum infernorum V4的全基因组测序88-113
- 第一章 引言89-92
- 第一节 研究背景简介89-90
- 1.1.1 温室效应和温室气体89
- 1.1.2 甲烷利用细菌89-90
- 1.1.2.1 甲烷利用细菌的的基本情况89
- 1.1.2.2 甲烷利用途径89-90
- 1.1.3 疣微菌门(Verrucomicrobia)90
- 第二节 本项工作的研究目标、内容和创新性90-92
- 1.2.1 研究目标90
- 1.2.2 研究内容90-91
- 1.2.3 创新性91-92
- 第二章 材料与方法92-96
- 第一节 实验材料92-94
- 2.1.1 菌株92-93
- 2.1.2 序列93-94
- 第二节 实验方法94-96
- 2.2.1 M.infernorum V4的全基因组测序和拼接94
- 2.2.2 M.infernorum V4的基因组预测与注释94
- 2.2.3 M.infernorum V4中基因的分类94-95
- 2.2.4 M.infernorum V4的进化定位95
- 2.2.5 M.infernorum的基因组构成95-96
- 第三章 结果与分析96-112
- 第一节 M.infernorum V4的基因组结构96-97
- 第二节 M.infernorum V4的系统发育97-102
- 3.2.1 通过rRNA和核糖体蛋白进行进化树重建97-99
- 3.2.2 通过BLAST定位蛋白质的种属99-100
- 3.2.3 M.infernorum的基因构成100-101
- 3.2.5 PVC超门的进化关系101-102
- 第三节 M.infernorum V4的特异基因情况102-103
- 第四节 M.infernorum V4的代谢重建和其对甲基营养的特殊适应103-112
- 3.4.1 甲基营养相关的途径103-107
- 3.4.1.1 甲烷单加氧酶基因103-105
- 3.4.1.2 甲烷氧化途径105-107
- 3.4.2 核心代谢途径和它们的改变107-108
- 3.4.3 退化的细胞分裂机制108-109
- 3.4.4 M.infernorum对于酸性环境的适应109-110
- 3.4.5 抗病毒与应激系统110-112
- 第四章 结论112-113
- 第四部分 (Ⅳ)大肠杆菌O55:H7菌株CB9615的全基因组测序和生物信息学分析113-143
- 第一章 引言114-120
- 第一节 研究背景介绍114-117
- 1.1.1 大肠杆菌114-115
- 1.1.1.1 大肠杆菌基本信息114
- 1.1.1.2 大肠杆菌的核心基因组114-115
- 1.1.2 进化速率研究115
- 1.1.3 致病大肠杆菌O157:H7和O55:H7115-116
- 1.1.4 ABI 3730测序116-117
- 1.1.5 从头测序与鸟枪法拼接117
- 第二节 本工作的研究目标、内容和创新性117-120
- 1.2.1 研究目标118
- 1.2.2 研究内容118
- 1.2.3 创新性118-120
- 第二章 材料与方法120-125
- 第一节 实验材料120-121
- 2.1.1 菌株120
- 2.1.2 序列120-121
- 第二节 实验方法121-125
- 2.2.1 基因组DNA提取121-122
- 2.2.2 基因组测序122
- 2.2.3 注释与分析122
- 2.2.4 产生三个基因组的比较结果,并确定重组区122
- 2.2.5 直系同源基因寻找以及对E.coli/Shgalla基因组的进化分析122-123
- 2.2.6 使用虚拟外参将突变定位在某个世系中123
- 2.2.7 使用虚拟外参分析将重组区定位在世系中123
- 2.2.8 使用虚拟外参技术分析缺失插入123-125
- 第三章 结果与分析125-140
- 第一节 基因组概述125
- 第二节 比较基因组学分析125-129
- 3.2.1 区分重组和突变事件125-126
- 3.2.2 将突变定位于特定的世系126-128
- 3.2.3 O55:H7和O157:H7的分离时间128
- 3.2.4 O157:H7和O55:H7世系内的分化128-129
- 第三节 重组129-135
- 3.3.1 O55与O157之间的重组129-132
- 3.3.2 大肠杆菌核心基因组的进化132-133
- 3.3.3 对ExPEC进化簇的重组区分133-135
- 第四节 插入和缺失135-136
- 3.4.1 O55:H7与O157:H7之间的基因改变135
- 3.4.2 插入缺失主要由噬菌体造成135-136
- 3.4.3 Block 172136
- 第五节 质粒136-138
- 第六节 CB9615和典型EPEC菌株E2348/69的基因组比较138-139
- 第七节 O157:H7和O55:H7的比较蛋白质组学139-140
- 第四章 讨论140-142
- 第一节 O55:H7与O157:H7之间的遗传改变140
- 第二节 三型分泌系统作用因子140
- 第三节 重组分离与分子钟140-142
- 第五章 结论142-143
- 第五部分 (Ⅴ)大肠杆菌K-12菌株MC4100的全基因组测序143-169
- 第一章 引言144-154
- 第一节 研究背景简介144-152
- 1.1.1 大肠杆菌K-12简述144-145
- 1.1.1.1 大肠杆菌K-12是最主要的实验室菌株之一144
- 1.1.1.2 大肠杆菌K-12 MG1655是第一个被测序的K-12菌株144
- 1.1.1.3 大肠杆菌K-12 W3110与MG1655的比较144-145
- 1.1.1.4 大肠杆菌K-12 DH10B的全基因组145
- 1.1.1.5 大肠杆菌K-12中存在许多遗传改变145
- 1.1.2 大肠杆菌K-12 MC4100145-146
- 1.1.2.1 大肠杆菌K-12 MC4100的历史145-146
- 1.1.2.2 大肠杆菌K-12 MC4100与MG1655的基因型和表型差异146
- 1.1.3 高通量测序法146-149
- 1.1.3.1 高通量测序的历史146-148
- 1.1.3.2 Roche 454和Solexa是目前的主流测序技术148
- 1.1.3.3 Roche 454 GS FLX测序技术简介148-149
- 1.1.4 基于de Bruijin图的高通量测序拼接技术149-152
- 第二节 本工作的研究目标、内容和创新性152-154
- 1.2.1 研究目标152
- 1.2.2 研究内容152-153
- 1.2.3 创新性153-154
- 第二章 材料与方法154-159
- 第一节 实验材料154-156
- 2.1.1 菌株154
- 2.1.2 序列154-155
- 2.1.3 软件、程序以及数据库155-156
- 第二节 实验方法156-159
- 2.1.1 BW2952的全基因测序与拼接156-157
- 2.1.1.1 BW2952基因组DNA的提取156
- 2.1.1.2 Roche 454 FLX测序156
- 2.1.1.3 ABI 3730测序156-157
- 2.1.1.4 Roche 454测序结果的拼接157
- 2.1.1.5 使用phrap进行杂交拼接157
- 2.1.2 注释与分析157-158
- 2.1.2.1 基因预测与基因注释157-158
- 2.1.2.2 产生SNP图158
- 2.1.2.3 重组区预测与SNP定位158
- 2.1.3 rssAB扩增158-159
- 第三章 结果与分析159-167
- 第一节 基因组主要特点159
- 3.1.1 MC4100(MuLac)基因组测序结果159
- 第二节 K-12的比较基因组学分析159-165
- 3.2.1 四个K-12基因组之间的主要区别159-161
- 3.2.2 K-12基因组中非编码RNA的差异161
- 3.2.3 K-12基因组中的SNP差异161-165
- 3.2.3.1 SNP的人为定义161
- 3.2.3.2 重组区161-162
- 3.2.3.3 绘制SNP比对图162
- 3.2.3.4 SNP的详细分析162-163
- 3.2.3.5 将SNP定位至不同世系163-164
- 3.2.3.6 不同世系中SNP的差异164-165
- 第三节 BW2952中遗传改变与表型的关系165-166
- 3.3.1 BW2952中特异的碱基改变165
- 3.3.1 碱基改变造成的表型差异165-166
- 第四节 λplacMu50载体的全序列166-167
- 第四章 讨论167-168
- 第一节 K-12实验室菌株中的遗传区别167
- 第二节 遗传改变的不可控和对试验的影响167-168
- 第五章 结论168-169
- 第六部分 (Ⅵ)大肠杆菌K-12菌株MC4100衍生菌株的全基因组测序169-190
- 第一章 引言170-175
- 第一节 研究背景简介170-173
- 1.1.1 进化的多样性170-171
- 1.1.1.1 多样性进化的各种解释170-171
- 1.1.2 基因调控改变造成进化飞跃171-172
- 1.1.3 无机磷酸盐限制条件下细菌的调控变化172
- 1.1.4 Solexa测序技术简介172-173
- 第二节 本项工作的研究目标、内容和创新性173-175
- 1.2.1 研究目标173
- 1.2.2 研究内容173-174
- 1.2.3 创新性174-175
- 第二章 材料与方法175-178
- 第一节 实验材料175-176
- 2.1.1 菌株175-176
- 第二节 实验方法176-178
- 2.2.1 Solexa Paired-end样品制备176
- 2.2.2 Solexa双末端测序176-177
- 2.2.3 基于参照基因组的序列拼接177-178
- 第三章 结果与分析178-186
- 第一节 Pi限制恒化器中共存分离株的分离及其区别178-181
- 第二节 hfq突变的适应性181-182
- 3.2.1 hfq突变的基本情况181
- 3.2.2 hfq突变的检验181-182
- 第三节 rpoS突变的适应性182-184
- 3.3.1 rpoS基因突变的情况182-183
- 3.3.2 rpoS基因突变的校验183-184
- 第四节 spoT突变后的适应性184
- 第五节 hfq、spoT和rpoS突变适应的共性184-186
- 第四章 讨论186-189
- 第一节 MC4100衍生株上的突变186
- 第二节 调控突变186
- 第三节 应激/营养平衡是多样化的驱动力186-187
- 第四节 动态的变异187
- 第五节 恒定环境下的多种适应187-189
- 第五章 结论189-190
- 参考文献190-208
- 致谢208-209
- 作者简介及科研成果209-210
| 【共引文献】 | ||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
| 【相似文献】 | ||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||



