家蚕未受精卵表达序列标签(EST)分析
【摘要】:
家蚕是丝绸业的生物基础,通过EST测序从分子水平上获得大量数据,可为家蚕基因组结构和绝大部分基因提供信息,为进一步进行家蚕功能基因的研究奠定基础。
家蚕的EST数据的收集在新基因的发现、基因敲除的研究和基因芯片的制备以及发育分析等方面具有重大的价值。本实验以家蚕肾脏形卵和正常形卵的未受精卵为材料建立了cDNA文库,这些未受精卵的细胞中含有大量的早期胚胎发育所必需的信息。
母性基因是指这些未受精卵中所含有的大量影响后代发育的一类基因,这些基因在卵子发生过程中表达,在卵子发生过程或胚胎发育过程中翻译。母性基因在胚胎的早期发育阶段起着至关重要的作用,主要功能是决定轴的分化、卵裂方式的形成和形态的发生。在昆虫的早期发育中,胚胎的前后轴和背腹轴分别独立地由母性基因产物决定。这些母性基因主要编码转录因子或调控蛋白,它们的产物通常形成一定的浓度梯度并产生特异的位置信息,以进一步激活一系列合子基因的表达。随着这些基因的表达,胚胎被分成不同的区域。每个区域表达特异性基因的组合,沿前后轴或背腹轴形成一定的体节模式。未受精卵中的mRNA及蛋白质均属于母性基因产物。
本实验首先将获得的原始数据屏蔽载体序列,然后再去除低质量和小于100bp的小片段。这些EST序列再采用clustalW软件进行拼接。将获得的EST序列的六个阅读框用BLASTX软件与GeneBank中1,230,998条非冗余的蛋白质序列数据库进行比对,用BLASTN软件与GeneBank中1,453,916条核苷酸序列数据库进行比对,寻找具有相似性的蛋白质和核苷酸序列。对只知氨基酸序列但功能未知的基因,运用SMART软件分析其结构域,从而推测所获得的表达序列标签可能的性质和功能。另外这些数据还与家蚕EST数据库SILKBASE http://www.ab.a.u-tokyo.ac.jp/silkbase/中的28个cDNA文库的EST序列进行比对。对于已知基因则进入http://www/geneontology.org网址进行基因功能分类。
本实验最终成功获得391条EST序列,平均读长659hp。用。lusterb比较分析
后拼接得到374个非重复序列,其中最大的由4条EST组成,最长的为1958hp。374
条非重复序列中 15条是 contig,118条Singletons是正常型未受精卵中的 EST序
列,其余 24条是肾脏形未受精卵文库中的。通过大规模的 EST测序和分析,获得
了大量功能基因的信息。经生物信息学分析发现,171个与己知基因具有较高的相似
性(己知基因),25个与己知序列具有较高的相似性(新基因),其余178个为低度
相似或没有相似性的序列(未知基因)。
未受精卵文库提供了大量的母性基因的信息,本实验共获得3个与己知的母性
基因高度相似的 EST序列,分别是 BmVLG、。apu和 annexin hi3。其余则主要是一些
与DNA复制,能量代谢,信号传导以及胚胎发育中个体形成等相关的基因相似的序
列。这些有用的信息为母性基因功能的研究提供了序列信息,为进一步研究家蚕胚
胎早期发育的调控提供基础数据,同时还对家蚕功能基因组的研究具有重要推动作
用。