收藏本站
《山东大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

全基因组中网络缺失基因和微型转座子的发现及研究

陈勇  
【摘要】: 随着生物技术的发展,人们获得了大量的基因组数据并用以了解基因组的机制。越来越多的基因组被测序,分子生物学已进入了所谓的后基因组时代。现在我们能够直接探索基因组的一些全局特性,例如能够得到任意感兴趣基因在全基因组水平上的分布,并通过比较多种相关基因组来理解生物的各种机能等等。基因通过彼此间和代谢物间的物理和化学作用连接成复杂的网络关系,搞清楚完整的基因—蛋白质—新陈代谢网络的拓扑结构、局部组织形式和动态行为是系统生物学的最终目标。但是,现有的基因网络或者代谢途径(Pathway)还远远没有完善,许多构建的网络中存在着大量的缺失基因或者说“网络漏洞”,许多基因的功能和在网络中的具体位置还没有确定,生物网络中的许多节点和连接关系还有待于确定,这就是网络缺失基因问题。发现这些网络中的缺失基因是系统生物学中一个重要的挑战性工作。另外,具有翻转互补终端序列的微型转座子(简称微型转座子或者MITEs)是基因组中的一种重要的功能基因,它能够通过自身的位置转移、增加拷贝数等行为影响基因组的大小和基因的功能实现。在基因组水平中,发现所有的微型转座子及其分布能够让我们更加深入地了解基因组的功能实现以及进化历史。对于发现缺失基因问题和发现微型转座子问题,本文分别给出了有效的算法,能够快速准确地在全基因组水平下发现所有可能缺失基因和微型转座子。本文的主要的研究内容和创新点如下: ·主要研究内容 对于发现缺失基因问题,我们利用operon信息,基因相似性信息以及phylogenetic profile信息构造了一个基因组参考图,并利用图论算法和设计了新的信息融合和基因排序方法,在整个基因组水平下发现缺失基因。为了进一步提高方法的精度和效率,我们又利用了regulon信息:首先我们给出了一个寻找motif的有效算法,并利用该算法计算了目标基因组中的所有可能的regulon,然后将该信息运用到基因组参考图中。实验结果表明,该方法非常有效,不但在目标网络中发现了大量的相关缺失基因,进一步揭示了基因网络的结构和功能特性,极大地提高了现有基因网络的精度,而且具有极强的鲁棒性。 对于发现微型转座子问题,我们首次给出了一个在基因组范围内寻找和分析微型转座子的算法,并且实现了网络在线服务(MUST系统)http://csbll.bmb.uga.edu/ffzhou/MUST/。在许多原核生物基因组的应用试验中,我们的系统首次发现了大量的具有近期活性的微型转座子,并且该系统还首次发现了微型转座子与operon、微型转座子与相邻基因之间存在着影响关系,这些发现为揭示基因组的动态变化以及基因功能实现奠定了基础。 第一章绪论,首先给出了本文中用到的生物学,图论以及计算复杂性理论的基础知识介绍。 第二章首次给出了一个利用operon信息,基因相似性信息以及phylogeneticprofile信息来发现网络缺失基因的方法。通过比较基因组大小和进化关系,我们共选择了185个基因组来构造基因组参考图。该参考图以所有的基因为顶点,两个基因之间有边存在当且仅当它们在同一个operon中,或者它们是相似基因。对于目标pathway,我们利用其所有的已知基因作为参考基因,再寻找所有到参考基因关系最为紧密的基因来构成候选基因集合,并给出了分层的信息融合和排序的方法来确定最终的基因排序。我们测试了KEGG数据库中E.coli的所有121个pathway。结果显示如果目标pathway中已知基因的个数大于5个,该方法的正预测值(PPV)可以达到60%,并且随着基因个数的增加,可以达到90%,这一预测精度远远大于现有的相关算法,而且参数分析显示该方法具有高度的鲁棒性。同时许多预测的结果已经被近期更新的KEGG数据库的结果证实是正确的。实验结果还发现许多pathway可能在更高的结构层次上具有功能一致性,这进一步深化了pathway的结构和功能特性研究。 第三章,给出了一个寻找motif的有效算法,该算法提出了序列邻集、概率打分矩阵等新的概念,并利用递归的计算策略来去除噪音。在许多实际的生物序列的测试中,该算法能够比相关的算法更有效的发现真正的motif。 第四章,为了进一步提高发现缺失基因方法的精度,我们又引入了regulon信息。我们首先利用第三章中发现motif的算法描述了目标基因组中所有的regulon结构,然后将此信息融合到第二章中的基因组参考图中。试验显示,regulon信息进一步提高了寻找缺失基因算法的精度,对于所有基因个数大于20的pathway,平均的PPV率进一步提高了约2%。 第五章首次给出了一个全基因组水平下发现所有可能微型转座子的算法,并且实现了在线服务(MUST系统)http://csbll.bmb.uga.edu/ffzhou/MUST/。该算法可以按照微型转座子的结构和序列相似性进行分类,同时输出许多相关统计和进化信息。应用MUST系统,我们成功地在Anabaena variabilis ATCC 29413验证了已经被深入研究的微型转座子族Nezha,同时还发现了新的具有近期活性的微型转座子。另外,我们首次在Haloquadratum walsbyi DSM 16790中发现了多个微型转座子族,这些微型转座子族均具有保守的终端结构和高度的序列相似性,并且发现了近期活性的进化痕迹。Haloquadratum walsbyi DSM 16790是一种极端耐盐的细菌。这是首次在此极端细菌中发现微型转座子,这些大量微型转座子族的存在进一步揭示了微型转座子可能参与到极其重要的基因组功能活动中,并且这种活动甚至在极端环境下生存的物种中依然比较活跃。 第六章首次在Leptospira中发现了微型转座子Yuanxiao,该微型转座子大量存在于Leptospira的四个近缘物种中。Leptospira是一种病原体,可以导致一种称为钩端螺旋体病的人畜传染病。我们研究发现微型转座子Yuanxiao与转座基因ISLin1之间存在着进化关系,说明微型转座子可能是通过删除转座基因中的编码蛋白区域而进化得到的。研究表明该微型转座子还可能参与到相邻基因的调控过程中,这为研究微型转座子的生成,扩增以及转移机制提供了很好的研究基础。同时,也在基因层面上为解释该治病体的基因表达及功能变化提供了新的思路。 第七章首次在Geobacter uraniireducens Rf4中发现了具有近期活性的微型转座子Chunjie,首次观察到Chunjie能够插入到operon结构中,并且没有破坏operon的结构。这进一步揭示了微型转座子的转移特性,并首次揭示了微型转座子对operon结构的进化影响关系。 最后一章总结全文。 ·本文的创新点 创新点1.首次利用三种信息给出了在全基因组水平下发现网络缺失基因的方法,利用多基因组的比较在最大程度上发现目标网络中的缺失基因。方法具有高精度和高鲁棒性,极大地提高了目前相关方法的精度和结果。对于E.coli的121个目标pathway,该方法发现了大量的缺失基因,同时还在pathway内部和pathway之间发现了新的结构连接,为进一步研究基因网络的功能和结构特性奠定了基础。 创新点1列于第二章中。 创新点2.提出了一个新的寻找转录因子motif的有效算法,并用之计算了目标基因组中所有的regulon结构,并且将regulon结构信息融合到寻找网络缺失基因的方法中,进一步提高了寻找网络缺失基因方法的精度。 创新点2列于第三、四章中。 创新点3.首次给出了在全基因组水平下寻找和分析微型转座子的方法,并实现了在线服务(MUST系统)。对于给定的基因组,该系统能够发现所有可能的微型转座子并给出许多相关特性的分析。利用该系统,我们首次观察到Haloquadratum walsbyi DSM 16790中存在着大量的微型转座子族。这个现象首次揭示了微型转座子在极端微生物(耐盐)中依然活跃并且发挥着重要的作用。 创新点3列于第五章中。 创新点4.首次在Leptospira中发现了一个具有近期活性的微型转座子族Yuanxiao。并发现该微型转座子和某些特定的转座基因之间存在着结构和序列相似性,同时还可能在相邻基因的转录调控中发挥作用。Yuanxiao的发现为进一步研究微型转座子的产生、扩增、转移机制提供了样本,同时也为揭示Leptospira的致病机理提供新的思路。 创新点4列于第六章中。 创新点5.首次在Geobacter uraniireducens Rf4中发现了一个具有近期活性的微型转座子族Chunjie,并且发现Chunjie成功地插入到了一个operon结构中。这是首次发现微型转座子插入到operon结构中而没有破坏operon结构和功能,为研究原核生物基因组变化,特别是operon进化提供了直接的证据。 创新点5列于第7章中。
【学位授予单位】:山东大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:Q75

【共引文献】
中国期刊全文数据库 前10条
1 田海霞;;转座子在基因组和基因进化方面的研究进展[J];安徽农业科学;2011年20期
2 秦洪,王攻本;求最佳生物序列并置排列的算法和程序[J];北京大学学报(自然科学版);1991年01期
3 李玉鑑;生物序列的邻位约束比较方法[J];北京工业大学学报;2005年05期
4 罗洁;潘国庆;周泽扬;;微孢子虫转座元件的研究现状[J];蚕学通讯;2008年02期
5 谢雪英,孙啸,陆祖宏;卡方检验确定背景序列模型Markov chain的阶数(英文)[J];Journal of Southeast University(English Edition);2003年04期
6 曹爱忠;陈全战;王海燕;王秀娥;陈佩度;;基于专化的反转录转座子序列开发鉴定簇毛麦染色质的PCR分子标记[J];西北植物学报;2007年06期
7 孙海悦;张志宏;;植物基因组中微型反向重复转座元件研究进展[J];西北植物学报;2007年12期
8 谢强,卜文俊;核苷酸序列比对在生物系统发育研究中的应用[J];动物分类学报;2005年02期
9 舒友菊;王贵学;郑家奎;蔡平钟;张志勇;;K型和冈型水稻线粒体DNA的AFLP分析[J];重庆大学学报(自然科学版);2007年12期
10 卢国祥;沈世镒;;由一般拓扑度量空间所产生的Alignment空间[J];工程数学学报;2008年06期
中国博士学位论文全文数据库 前10条
1 马勤;原核生物中调节子的研究和预测[D];山东大学;2010年
2 李艳文;信号Pathway预测方法研究[D];吉林大学;2011年
3 杨惠;条斑紫菜功能基因组及重复序列特征研究[D];中国海洋大学;2011年
4 郝彤;基因组尺度人类代谢网络的亚细胞及组织定位[D];天津大学;2010年
5 王飞;果梅LTR类逆转座子序列特征及遗传多样性的SSAP分析[D];南京农业大学;2010年
6 江彪;甜瓜属Ty1-copia类逆转座子分析及其对异源四倍体遗传变异的影响研究[D];南京农业大学;2011年
7 李菲;小麦/长穗偃麦草体细胞杂种渐渗系新种质的遗传基础研究[D];山东大学;2011年
8 刘春;小麦渐渗系SR3的EST序列和表达谱分析[D];山东大学;2011年
9 孙亮先;水稻胚乳及幼苗基因表达谱的研究[D];浙江大学;2002年
10 崔永兰;石蒜属植物cDNA文库构建与表达序列标签(EST)分析[D];南京林业大学;2004年
中国硕士学位论文全文数据库 前10条
1 赵振华;模体发现问题的若干算法及应用研究[D];西安电子科技大学;2009年
2 胡慧泽;基于分步查找的高效复合模式查找算法[D];西安电子科技大学;2010年
3 戈鲁宁;基于吉布斯采样的模体识别算法研究[D];西安电子科技大学;2010年
4 詹海萍;弱信号模体检测的图搜索算法[D];西安电子科技大学;2010年
5 周敬;一种有效的SDA模体发现算法[D];西安电子科技大学;2009年
6 程志远;二穗短柄草的遗传转化及诱导型Ac/Ds转座系统在短柄草中的初步应用[D];山东农业大学;2011年
7 田海霞;基于PCR方法检测转座子对拟南芥基因进化的适应性研究[D];东北农业大学;2011年
8 王晓芳;昆虫piggyBac转座子结构功能研究[D];南京农业大学;2011年
9 张璐;水稻Gaijin类MITE在辐照条件下的转座活性鉴定[D];浙江大学;2011年
10 何伟;使用随机投影技术发现生物序列特征的算法[D];郑州大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 马雪梅,高东,邹文;转座子Tn916接合转移诱变棒杆菌[J];微生物学通报;1994年04期
2 王石平,张启发;高等植物基因组中的反转录转座子[J];植物学报;1998年04期
3 姚新灵,白桦;玉米转座子、GBSSI基因及表达研究进展[J];生物技术;2000年04期
4 朱正歌,肖晗,傅亚萍,胡国成,于永红,斯华敏,张景六,孙宗修;水稻转座子突变体库的构建及突变类型的遗传分析[J];生物工程学报;2001年03期
5 柳晓峰;;基因会跳舞[J];生命世界;2007年11期
6 叶眺新;三旋理论[J];大自然探索;1992年04期
7 ;美科学家发现“自私DNA”在进化中起重要作用[J];中学生物教学;2010年05期
8 陈剑民,洪孟民;转座子Tn233(CH)缺失突变株特性的研究[J];遗传学报;1985年04期
9 孙国凤;;普杜大学利用转座子插入失活法鉴定抗病害基因[J];生物技术通报;1989年06期
10 蔡玉红,邢少辰;植物转座子在基因克隆中的应用[J];邯郸农业高等专科学校学报;2000年03期
中国重要会议论文全文数据库 前10条
1 邹曙明;杜雪地;蒋霞云;;鱼类转座子在鱼类转基因和基因捕获中的研究[A];2010年中国水产学会学术年会论文摘要集[C];2011年
2 曹慧英;李洪杰;朱振东;王晓鸣;;玉米细菌干茎腐病菌Pantoea agglomerans致病相关基因的克隆[A];中国植物病理学会2010年学术年会论文集[C];2010年
3 曲志才;姜曰水;;山东部分地区灰飞虱mariner类转座子研究[A];中国遗传学会第八次代表大会暨学术讨论会论文摘要汇编(2004-2008)[C];2008年
4 钟仰进;杨婉莹;曹阳;黄亚东;温硕洋;劳海华;陈维春;;家蚕K1.4转座子的拷贝多态性及K1.4主拷贝的序列特征研究[A];中国的遗传学研究——中国遗传学会第七次代表大会暨学术讨论会论文摘要汇编[C];2003年
5 周明兵;梁银燕;胡娇丽;钟浩;汤定钦;;毛竹基因文库的构建及Mariner-like和PIF-like转座元件的筛选[A];第六届全国林木遗传育种大会论文集[C];2008年
6 毛国璋;康耀卫;何礼远;宋伯符;;转座子Tn5对马铃薯青枯菌的诱变[A];“植物病虫害生物学研究进展”——植物病虫害生物学国家重点实验室研究论文选[C];1995年
7 郭基涛;周旭宇;;Tn5AraOut转座子随机突变:Yersinia pestis的抗菌肽抵抗基因的鉴定[A];2010年中国科学院微生物研究所博士后学术年会暨第二届博谊论坛论文摘要集[C];2011年
8 张云峰;;小麦中转座子存在的可能性初探[A];中国细胞生物学学会第五次会议论文摘要汇编[C];1992年
9 彭于发;黄大昉;张中鸽;陈彩层;张杰;;转座子诱变及在荧光假单胞菌防病增产上的应用[A];全国生物防治学术讨论会论文集[C];1991年
10 罗一博;张力;武美玲;朱江;刘忠华;;PiggyBac转座子介导EGFP在猪体细胞和克隆胚胎中的表达[A];中国畜牧兽医学会动物繁殖学分会第十五届学术研讨会论文集(上册)[C];2010年
中国重要报纸全文数据库 前10条
1 冯卫东;转座子荣居自然界最丰富基因榜首位[N];科技日报;2010年
2 本报记者 冯卫东;遗传基因中的“侵略者”[N];科技日报;2008年
3 程光胜、戴秀玉;缘悭一面廿五年[N];科技日报;2005年
4 廖宝红 记者  刘廉君;植物核基因水平转移分子证据被发现[N];科技日报;2006年
5 主持人:彭电子 中国畜牧报专刊部主任,《东方畜牧周刊》常务副主编;为安全,饲用抗生素前景黯淡[N];中国畜牧报;2002年
6 孙迎基 编译;让新药研发随心所欲[N];医药经济报;2002年
7 郑灵巧;猪链球菌7型对四环素耐药[N];健康报;2008年
8 朴淑瑜;科学家找到大麦白粉病“元凶”[N];科技日报;2010年
9 本报记者 吴洁;太空育种地上忙[N];科技日报;2001年
10 华南农业大学 王秀梅 刘雅红;探究耐药菌株产生的诱因[N];中国畜牧兽医报;2006年
中国博士学位论文全文数据库 前10条
1 王真慧;基于全基因组重测序技术分析水稻和菰渐渗系的基因组变异[D];东北师范大学;2013年
2 王锦;水牛乳腺基因表达谱与生长激素转基因水牛的初步研究[D];广西大学;2013年
3 韩民锦;家蚕MITE转座子的鉴定、进化和功能以及家蚕转座子的进化动力学研究[D];西南大学;2013年
4 张欣城;metK对那西肽生物合成的影响和链霉菌高效转座系统的构建[D];复旦大学;2009年
5 李思圆;激光辐射诱导水稻发生可遗传DNA甲基化变异和转座子激活及其可能机制研究[D];东北师范大学;2011年
6 韩乃君;转座子介导的伪狂犬病毒重组狂犬病疫苗构建与免疫研究[D];吉林大学;2012年
7 钱叶雄;低能离子诱导玉米Mu转座子激活及DNA甲基化表观遗传机制的研究[D];安徽农业大学;2011年
8 白丁平;PiggyBac转座子介导的转E.coli半胱氨酸合成酶基因绒山羊研究[D];西北农林科技大学;2012年
9 韩延超;Tol2转座子介导的斑马鱼诱变及Grhl2对内耳发育的调控[D];清华大学;2012年
10 郑小凤;Tol2转座子介导的斑马鱼诱变及nup107突变体研究[D];清华大学;2012年
中国硕士学位论文全文数据库 前10条
1 田海霞;基于PCR方法检测转座子对拟南芥基因进化的适应性研究[D];东北农业大学;2011年
2 彭玲;植物内生生防蜡样芽孢杆菌0-9菌株转座子插入突变体库的建立及评价[D];河南大学;2011年
3 许红恩;家蚕转座子数据库BmTEdb的构建[D];西南大学;2012年
4 朱宇辰;镉抗性细菌Cupriavidus campinensis KQ46的分离鉴定及其镉抗性机制研究[D];南京农业大学;2013年
5 刘红磊;人工合成甘蓝型油菜不同世代中转座子甲基化变化规律的研究[D];西南大学;2014年
6 李帑洛;不同倍性鱼及其父母本中短散在重复序列的遗传变异与多样性研究[D];湖南师范大学;2012年
7 殷文超;一氧化氮(NO)胁迫诱导水稻转座子发生遗传和表观遗传变异[D];东北师范大学;2010年
8 杜雪地;金鱼Tgf2转座子的研究及其转基因应用[D];上海海洋大学;2011年
9 张化浩;家蚕中Tcl/Mariner转座子的全基因组鉴定及进化分析[D];西南大学;2012年
10 王丹;激光辐射诱导水稻吉粳88号可遗传DNA甲基化变异和转座子转座激活的研究[D];吉林农业大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026