斯氏假单胞菌(Pseudomonas stutzeri)A1501的基因组学研究
【摘要】:斯氏假单胞菌A1501是我国科学家于1980年自稻田分离到的一种联合固氮菌。该菌在微好氧状态下具有明显的固氮活性,而且固氮产物能够迅速被水稻直接吸收利用。20多年来,我国科学家对该菌进行了系统的研究,在深入了解该菌固氮活性的基础上,进行了菌种的改造开发,以该菌为出发菌株的耐铵固氮工程菌是我国第一例进入商品化生产阶段的植物用基因工程固氮菌。
为了更好的开发和利用该菌株,我们对该菌进行了基因组学研究,采用全基因组“shotgun”的方法,并在实际造作中进行了技术改进。我们构建了插入片段分别为2-4K(s文库)和4-6K(L文库)的基因组随机文库。对L文库进行两端测序,打造基因组的框架,对S文库进行单向测序,填充框架内信息。通过大规模、高通量的测序平台,我们最终获得了50408个有效reads,平均有效长度为609bp,总长度30.7M。经过几轮补GAP反应、计算机拼接以及低质量区域核实,最终得到A1501的基因组精确图。
斯氏假单胞菌A1501的基因组全长4567418 bp,编码4145个ORFs。与已经完成基因组测定的三个假单胞菌P.aeruginosa PA01、P:putida KT2440和P.syringae pv.tomato DC3000相比,其基因组长度以及编码ORFs的数量只是其他三株的73%左右,但是编码区占基因组的比例相差不大。蛋白同源性比较表明,A1501菌的4145个ORFs中有2734个可以在Pseudomonas putidaKT2440中找到对应的同源蛋白;有2560个ORFs可以在Pseudomonas syringae pv.tomato DC3000中找到对应的同源蛋白;有2954个ORFs可以在Pseudomonas aeruginosa PA01中找到对应的同源蛋白。2085个ORFs在这四株假单胞菌基因组里是共有的。
基因根据其已知的功能或与已知功能基因的同源性,可以划分为三类:1,与其他生物中己知功能的基因具有同源性;2,与已报导的未知功能的基因同源;3,与所有已报导基因没有同源性。在A1501中,第一类基因有3366个,占ORFs总数的81.2%;第二类基因有473个,占ORFs总数的11.4%;第三类基因,即A1501基因组独特的ORFs有316个,占ORFs总数的7.6%。
将这些ORFs按照COGs库进行分类,划分为23个功能组以及未知功能组和假设功能组,共25个组。每个功能组的基因在该菌的生命活动中起不同的作用。对这些基因的初步分析表明,在长期的进化过程中,A1501菌形成了一套与自身环境高度适应的系统。如:厌氧状态下,该菌可以以硝酸盐或亚硝酸盐为底物进行反硝化作用,产生能量;具有鞭毛结构,可以自由运动并在趋化剂的诱导下到达植物的根部,获得碳源;具有Ⅳ型菌毛结构,可以特异性粘附在植物的根表甚至进入根组织,从而与植物保持长期稳定的共生关系。
斯氏假单胞菌A1501基因组的完成是该菌研究过程中的一个突破,是国际上第一例完成的联合固氮菌的基因组,对于我们从整体上全面认识联合固氮菌的遗传背景、代谢网络以及固氮机制提供了最全面、最原始的基础数据,为进一步开展功能基因组学,蛋白质组学等相关研究奠定了坚实的基础。