收藏本站
《西南大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

家蚕基因组数据库的构建及应用

段军  
【摘要】: 家蚕是重要的经济昆虫,也是鳞翅目昆虫的典型代表。实施家蚕基因组计划具有重要意义,一方面可以促进家蚕的生理、生化、代谢等方面的基础研究,阐明与茧丝形成相关的分子机制,为利用现代生物技术手段改造传统蚕丝产业打下基础;另一方面也可以为农林业害虫的防治提供新的思路和方法。另外,以家蚕作为生物反应器的研究也受到人们的关注。 在人类基因组计划和其它模式生物基因组计划的带动下,2003年完成了家蚕全基因组测序,由中国和日本分别获得了序列覆盖度为6倍和3倍的基因组框架图。然而,该基因组框架图覆盖基因组还不完整、部分基因也只是碎片。为了获得更高质量的家蚕基因组序列图谱,中国和日本就构建家蚕基因组精细图谱开展了合作,相互交换测序数据,共同填补基因组空缺和开发分子标记,最后对家蚕基因组数据进行统一的拼接组装,于2007年共同完成了家蚕基因组精细图。 高质量的家蚕基因组精细图的完成,为下一步的家蚕基因功能研究提供了良好的基础。然而,如何让研究者能方便地访问到基因组精细图的数据资源,从而获得对基因功能研究有用的信息或线索,是目前迫切需要解决的问题。针对这一问题,本文采用了多种生物信息学方法对家蚕基因的功能进行了注释,并利用基因芯片数据分析了家蚕基因的表达情况,在整理这些数据及基因组精细图相关数据的基础上,成功构建了一个信息含量丰富、使用方便、分析工具齐全的家蚕基因组数据库。基于家蚕基因组精细图数据和基因组数据库,本文还对家蚕C2H2型锌指蛋白基因进行了鉴定和分析。获得的主要结果如下: 1.家蚕基因功能注释 本研究采用了多种生物信息学方法对家蚕基因的功能进行了预测,这些信息能为下一步的基因功能研究提供线索。 (1)序列相似性检索:根据序列上相似的基因可能在功能上也相似的原理,将家蚕的14623个预测基因到nr非冗余蛋白质序列数据库中进行序列相似性检索,以获得基因功能方面的提示。结果表明,有12246个基因能检索到相似基因(E-value<1E-5),占了家蚕基因总数的83.7%。其中有5250个基因高度保守(E-value<1E-80),分析显示,这些基因与DNA复制、能量代谢、蛋白质合成、脂类代谢、糖代谢等基础生理代谢过程相关。另外,还有2377个基因没有检索到相似基因,表明这些基因属于家蚕特异基因,推测它们可能与家蚕特异的生理代谢过程相关。 (2)蛋白质结构域分析:所谓基因的功能,主要指其编码的蛋白质的功能,其中,蛋白质结构域起着重要的作用。因此,分析基因中的蛋白质结构域可以为我们了解基因的功能提供重要的线索。利用InterPro数据库对家蚕基因中的蛋白质结构域进行分析,结果显示,有8522个基因具有蛋白质结构域,占了家蚕全部基因的58.2%。在这些基因中,总共含有2509种不同类型的蛋白质结构域,数量最多的结构域是C2H2、LRR_1、WD40、Ank、I-set等。根据蛋白质结构域的信息来预测基因功能,一方面能弥补序列相似性检索的不足,有79个基因在序列相似性检索的时候没能获得功能注释,但是利用蛋白质结构域信息却获得了基因的功能信息;另一方面,针对具有多个蛋白质结构域的基因,利用蛋白质结构域的信息可以更全面地反映基因的功能。 (3)基于直系同源基因数据库的分析:COG直系同源基因数据库是一个存储不同物种中直系同源基因的数据库。基于该数据库,对家蚕的基因进行了分析。结果显示,总共有7839个基因能被划分到相应的直系同源基因簇中(E-value<1E-5)。其中,基因分布比较多的功能类别有基础功能簇、信号传导机制簇、翻译后修饰簇、蛋白更新和分子伴侣簇、脂质转运和代谢簇等,分别含有1602、987、593、436、391个家蚕基因。另外,我们还利用COG数据库中的物种特异基因库对家蚕的基因进行了分析。结果显示,有533个基因能划分到相应的物种特异基因簇中(1E-5)。其中有475个基因属于家蚕和果蝇的特异基因簇,说明这些基因都属于昆虫特异基因,它们可能与昆虫特异的生理代谢过程密切相关。 结合以上三种方法,有6580个基因在三种方法中都能获得注释。这几种方法有各自的优缺点,通过将多种方法结合,可以更全面地反映基因的功能信息。 2.家蚕基因芯片数据分析和数据库构建 基因在不同时间和空间的表达差异决定着生物体的发育、分化、细胞周期调控、衰老、程序性死亡等生理代谢过程。为了在全基因组水平上获得基因表达信息,本实验室与生物芯片北京国家工程中心合作,共同定制完成了世界上第一张家蚕全基因组寡核苷酸基因芯片,并利用该芯片对家蚕5龄第3天幼虫的中肠、体壁、头、血液、精巢、卵巢、前中部丝腺、后部丝腺、脂肪体、马氏管这10个组织(或样品)中的基因表达谱进行了检测。本研究对获得的基因芯片数据进行了分析和可靠性检验,并构建了家蚕芯片数据库来提供这些数据的对外访问。 基于基因芯片数据,分析发现,总共有10393个基因能检测到表达(即至少在一个组织中表达),占了芯片中全部基因总数的44.5%。其中有306个基因在每个组织中都高量表达,分析显示,这些基因中很多都属于看家基因,如核糖体蛋白基因、微管蛋白基因、翻译延长因子基因、肌动蛋白基因等。对组织特异表达基因进行分析,发现至少有1642个基因存在组织特异性表达,这些基因在精巢、中肠、马氏管等组织中分布较多,分别拥有1104、216、110个组织特异表达基因。结合基因的功能注释信息进行分析,结果显示,组织特异表达基因与组织的生理功能密切相关。对只在两个组织间共表达的家蚕基因进行了鉴定分析,发现至少有209个基因只在两个组织间共表达。分析显示,这些基因反映了组织间存在相似的生理功能或细胞组分。 为了评估芯片数据的可靠性,我们采用了信息分析、实验验证等多种方法进行评估,结果都表明芯片数据是可靠的,说明我们的数据分析过程也是准确的。在整理基因芯片表达数据的基础上,我们成功地构建了家蚕芯片数据库BmMDB(http://silkworm.swu.edu.cn/microarray),使人们可以方便地访问到家蚕基因芯片数据。 3.家蚕基因组数据库构建 随着家蚕基因组精细图的完成,基因组的质量显著提高,获得了高质量的预测基因集,并且有87.4%的基因组序列能定位到染色体上。为了提供对精细图数据资源的访问,并提供更多的综合信息,本研究在整理数据资源的基础上重新构建了家蚕基因组数据库。新数据库的访问地址为:http://silkworm.swu.edu.cn/silkdb或http://silkworm.genomics.org.cn. 在新的数据库中,采用了GBrowse基因组浏览器进行信息导航,替代了以前数据库中的MapView浏览器。GBrowse浏览器是一个国际上通用的基因组浏览器,基于GBrowse浏览器,可以方便地访问家蚕基因组上任意感兴趣的区域。同时,数据库中提供了多种检索方式,可以通过关键词、基因编号等进行检索,也可以通过网站中的BLAST工具对家蚕的ESTs序列、基因组序列、基因序列等进行序列相似性检索。基于基因组序列的染色体信息,我们还开发了家蚕染色体浏览器SCB和家蚕染色体定位工具SilkMap,方便对家蚕数据资源的使用。 基因页面是家蚕基因组数据库的核心,在基因页面中,可以显示基因的详细信息,如蛋白质结构域信息、GO分类信息、基因相似性注释信息、基因家族信息、基因表达信息、参考文献信息、基因序列等,这些信息能为进一步的基因功能研究提供重要参考和线索。 数据库中也提供了一些常用的在线分析工具,有利于对家蚕基因组数据进行信息分析。下一步,我们将逐步校正现有数据库中有问题的数据,并整理和添加更多的实验研究数据,如基因的SAGE信息、SNP信息、基因RNAi干涉后的表型信息、基因突变表型信息等,使数据库的信息含量更丰富。总之,家蚕基因组数据库的构建,必将在加速家蚕基因功能研究中发挥重要的作用。 4.家蚕C2H2型锌指蛋白的鉴定 C2H2型锌指具有DNA结合特异性,含有这类结构域的基因被称为C2H2型锌指蛋白基因,能在胚胎发育、细胞分化、变态等过程中起关键性的调控作用。利用Pfam数据库中C2H2型锌指的HMM模型(PF00096),对家蚕基因组中的C2H2型锌指蛋白基因进行了鉴定。结果显示,家蚕基因组中至少存在338个C2H2型锌指蛋白基因,占了全部基因总数的2.3%。与果蝇相比,家蚕的C2H2型锌指蛋白基因的数量和C2H2型锌指结构域的数量都显著增加。分析发现,家蚕中增加的这部分基因主要为含有10个以上C2H2型锌指的基因。 除了具有锌指结构域外,部分锌指蛋白还含有其它类型的结构域,被称为锌指偶联结构域,它们能辅助锌指蛋白激活或抑制目标基因表达。分析发现,家蚕中有90个C2H2型锌指蛋白具有锌指偶联结构域。统计显示,家蚕中数量最多的锌指偶联结构域是ZAD结构域,总共有50个ZAD结构域分布于50个家蚕基因中。与其它物种相比,线虫中没有ZAD结构域,人类基因组中也仅有1个该类结构域,而果蝇中含有87个ZAD结构域,说明ZAD结构域的数量在昆虫中特异性地增多了,推测含有ZAD结构域的基因的功能可与昆虫特异的生理代谢过程相关。 对家蚕C2H2型锌指蛋白基因在基因组上的分布进行分析,结果显示,有324个基因能定位到染色体上。以“邻近基因间的距离小于500kb”作为串联重复基因的标准,有241个基因能分布到59个串联重复基因簇。最大的一个簇位于第24号染色体上,在650kb的区域内分布了43个C2H2型锌指蛋白基因。大部分基因在染色体上成簇排列,说明串联重复在增加家蚕C2H2型锌指蛋白基因的数量方面起了重要作用。同时,串联重复也导致不同染色体上分布的基因数量极不均匀,家蚕中主要的C2H2型锌指蛋白基因集中在第11号染色体、第15号染色体和第24号染色体上,占了全部C2H2型锌指蛋白基因的38.8%。 基因家族分析有助于获得基因的功能线索。结合人、线虫、果蝇的基因,比较分析表明,家蚕的C2H2型锌指蛋白基因能划分为75个基因家族,其中有63个基因家族在进化上是保守的,即家族中至少有一个成员来自于线虫、果蝇或者人。在保守的基因家族中,有32个基因家族的成员只来源于果蝇和家蚕,说明这些家族属于昆虫特异的基因家族。在家蚕中,有12个家族属于家蚕特异的基因家族,再加上特异的单拷贝基因,家蚕中特异的C2H2型锌指蛋白基因的数量共有188个,相比线虫、果蝇、人分别只有120、125、160个特异的锌指蛋白基因,家蚕中特异的锌指蛋白基因数量显著增多。家蚕在吐丝、变态发育等方面具有独特的生物学过程,对这些家蚕特异的锌指蛋白基因的进一步功能研究,可能揭示出这些基因与家蚕特异生物学过程的联系。 5龄第3天是家蚕幼虫发育中最为重要的一个时期,此时家蚕开始丝蛋白的大量合成,并为变态作准备。我们利用芯片数据对家蚕C2H2型锌指蛋白基因在该时期不同组织中的表达情况进行了分析。结果显示,有132个基因在这个时期有表达,其中有33个基因在每个组织中都表达,14个基因表现出组织特异性表达。分析发现,表达的C2H2型锌指蛋白基因可能在这个时期发挥着十分重要的作用。例如,对于在所有组织中都表达的基因,BmZFP286基因属于DNJA5家族,可能与这个时期的蛋白折叠有关;BmZFP104属于Ab家族,推测该基因可能的作用是协调这个时期组织或器官的运动;BmZFP160与果蝇的crol基因在序列上高度相似,推测该基因可能已经受到蜕皮激素的诱导,并可能是一个蜕皮激素诱导的早期应答基因。 综上所述,本研究对家蚕基因组中的C2H2型锌指蛋白基因进行了鉴定,并通过分析获得了这些基因的基本信息,即染色体分布、基因家族信息和基因表达信息等,这些信息为进一步对家蚕C2H2型锌指蛋白基因进行功能研究打下了基础。
【学位授予单位】:西南大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:Q78

【相似文献】
中国期刊全文数据库 前10条
1 费建明;吴岩;占鹏飞;施国方;王文兵;;利用家蚕杆状病毒Bac-to-Bac系统表达大肠杆菌L-天冬酰胺酶Ⅱ[J];蚕桑通报;2011年02期
2 郝碧芳;王猛;沈兴家;;家蚕核型多角体病毒orf121克隆以及非翻译区分析[J];西北师范大学学报(自然科学版);2011年04期
3 庄兰芳;危浩;林健荣;钟伯雄;;家蚕hsp70启动子的克隆及功能研究[J];中国细胞生物学学报;2011年05期
4 葛俊楠;张剑韵;黄龙全;;家蚕磷酸吡哆醇氧化酶基因的表达谱分析[J];昆虫学报;2011年08期
5 陈睿;王在贵;杨文静;刘朝良;张宏福;唐湘方;张琛;陈敏;赵二双;李阿敏;;家蚕肠道产蛋白酶细菌的分离筛选与分子鉴定[J];中国微生态学杂志;2011年08期
6 丁农;张金卫;李江涛;鱼南洋;邹国平;冯世民;徐森华;;利用家蚕BmNPV生物反应器规模化生产基因工程产品的关键技术研究[J];中国蚕业;2011年03期
7 孔卫青;杨金宏;;家蚕BmNaPi基因的克隆表达与酵母穿梭表达质粒的构建[J];华北农学报;2011年03期
8 钟金凤;曹广力;薛仁宇;贡成良;;家蚕Aly/REF的基因克隆、序列分析及其细胞定位[J];昆虫学报;2011年07期
9 汪泰初;李瑞雪;郭秋红;谭安江;;哺乳动物N-糖基化途径中关键酶唾液酸合酶和CMP-唾液酸合成酶基因在转基因家蚕中的表达[J];昆虫学报;2011年08期
10 邓培渊;乔惠丽;李丹丹;鲁云风;李生才;阚云超;;家蚕化学感受蛋白BmCSP4表达谱及结合特性分析[J];昆虫学报;2011年08期
中国重要会议论文全文数据库 前10条
1 赵红平;;家蚕蚕茧与蚕丝的生物力学研究[A];北京力学会第十六届学术年会论文集[C];2010年
2 刘艳艳;池旭娟;方向明;阚雪芹;苏媚;刘文倩;王海玲;谈建中;;家蚕蛋白激酶C受体基因Bmrack的克隆及序列分析[A];中国蚕学会第六届青年学术研讨会论文集(1)[C];2009年
3 李兵;许雅香;卫正国;陈玉华;沈卫德;;生产高品位生丝家蚕新品种(苏秀×春丰)的选育[A];中国蚕学会第六届家蚕和柞蚕遗传育种学术研讨会论文集[C];2009年
4 宋方洲;常平安;张平波;易发平;马永平;;家蚕Fib-H、Ser-1基因探针在家蚕和中国野桑蚕的对比荧光原位杂交(FISH)研究[A];中国的遗传学研究——中国遗传学会第七次代表大会暨学术讨论会论文摘要汇编[C];2003年
5 宋方洲;常平安;张平波;易发平;马永平;;家蚕Fib-H、Ser-1基因探针在家蚕和中国野桑蚕的对比荧光原位杂交(FISH)研究[A];中国细胞生物学学会第八届会员代表大会暨学术大会论文摘要集[C];2003年
6 黄科;李春峰;范晓东;刘文明;周泽扬;;家蚕gapdh基因的克隆及分析[A];中国蚕学会第六届青年学术研讨会论文集(1)[C];2009年
7 张彩霞;鲍忠赞;周前凯;魏广兵;徐世清;司马杨虎;;家蚕正反交SAGE表达分析[A];中国蚕学会第八届暨国家蚕桑产业技术体系家(柞)蚕遗传育种及良种繁育学术研讨会论文集[C];2011年
8 苏金明;吴伟尉;司马杨虎;;家蚕试验小区雌雄比例差异性调查及分析[A];中国蚕学会第八届暨国家蚕桑产业技术体系家(柞)蚕遗传育种及良种繁育学术研讨会论文集[C];2011年
9 代方银;童晓玲;沈以红;罗亭玉;伴野丰;鲁成;向仲怀;;家蚕体形突变第2数珠蚕(mf-2)的遗传学研究[A];中国蚕学会第六届青年学术研讨会论文集(2)[C];2009年
10 陆叶;张孝林;郑小坚;薛仁宇;曹广力;贡成良;;IL-28A在家蚕BmN细胞及蛹体中的表达[A];中国蚕学会第六届青年学术研讨会论文集(2)[C];2009年
中国重要报纸全文数据库 前10条
1 秦得利;家蚕基因组研究成为竞争热点[N];农民日报;2002年
2 本报记者 姜晨怡;从1%到中国人的个体化基因组研究[N];科技日报;2009年
3 奇 云;21世纪“丝绸之路”仍从中国起步[N];大众科技报;2003年
4 记者 项铮;北京诺赛基因组研究中心成立十周年[N];科技日报;2008年
5 记者 刘传书;科学家启动“三极”动物基因组研究[N];科技日报;2009年
6 记者 谭大跃;世界三极动物基因组研究项目昨在深启动[N];深圳特区报;2009年
7 李国;中国家蚕基因组研究获重大突破[N];工人日报;2004年
8 记者 白毅;首个中国仓鼠卵巢细胞系基因组研究成果公布[N];中国医药报;2011年
9 本报记者 李国 实习生 杨海霞;家蚕基因研究的意义到底有多大[N];工人日报;2009年
10 记者 刘传书 冯竞;我家蚕基因研究又获重要成果[N];科技日报;2009年
中国博士学位论文全文数据库 前10条
1 于红松;家蚕黑色素合成途径基因的分子进化[D];西南大学;2011年
2 段军;家蚕基因组数据库的构建及应用[D];西南大学;2008年
3 沈以红;家蚕几种组织的EST及基因表达特征分析[D];西南农业大学;2003年
4 牛宝龙;家蚕(Bombyx mori) triosephosphate isomerase和transformer-2基因的克隆与染色体定位研究[D];浙江大学;2005年
5 李斌;家蚕分子连锁图谱的构建和低分子量热激蛋白基因的克隆与特异表达[D];西南农业大学;2001年
6 黄少康;两种微孢子虫的蛋白及对家蚕侵染性的比较研究[D];浙江大学;2004年
7 张开泰;HRNT-1(人ZA73)基因的识别[D];中国人民解放军军事医学科学院;1999年
8 陈复生;家蚕多倍体细胞遗传学研究[D];浙江大学;2003年
9 张美蓉;家蚕PcG家族分析及BmRYBP的功能研究[D];西南大学;2010年
10 王永强;家蚕无性繁殖系的构建及其遗传特性研究[D];浙江大学;2002年
中国硕士学位论文全文数据库 前10条
1 黄永燕;家蚕赤蚁突变的分子定位及淡赤蚁(ch~p)的分子基础初探[D];西南大学;2010年
2 刘淑梅;家蚕体主要药用活性成份的研究[D];浙江大学;2004年
3 曾凤辉;家蚕新基因BmEm4的克隆,表达与功能研究[D];浙江理工大学;2010年
4 江艳;BmCycH基因及其在家蚕中表达特性的研究[D];浙江理工大学;2010年
5 陈大霞;家蚕AFLP标记连锁图谱的构建与分析[D];西南农业大学;2003年
6 潘晔;家蚕丝氨酸蛋白酶抑制剂(Bmserpin-2)和类成虫盘生长因子(BmIDGF)的亚细胞定位及组织表达分析[D];江苏大学;2010年
7 孙德斌;家蚕AFLP分子标记连锁图的构建[D];西南农业大学;2001年
8 张春丽;家蚕中孕酮受体膜元件2的(PGRMC2)的表达纯化及功能初步分析[D];浙江理工大学;2010年
9 刘玉明;家蚕EST分析系统的构建及初步分析[D];浙江大学;2005年
10 马月;家蚕凋亡相关基因BmICAD的表达及其功能研究[D];浙江理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026