收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

M.xanthus DK1622基因组序列分析及新型随机兼并引物数据库的构建

周光涛  
【摘要】: 本文工作的主要内容包括两部分:粘细菌Myxococcus xanthus DK1622基因组序列分析和新型随机兼并(arbitrary degenerated,AD)引物数据库(AD Primer Database for Microbes,ADDB)的构建。 微生物基因组的序列分析需要借助于生物信息学技术,生物信息学技术大致可以分两个层次:数据管理和数据分析。数据管理是指通过数据库技术来有效地管理生物数据,本文将介绍一系列的生物学数据库。数据分析是指通过统计学、计算机技术从海量的生物数据中挖掘出信息和知识。对于微生物基因组序列分析,包括单个基因组序列分析和比较基因组分析。单个基因组序列分析主要包括基因组注释,以及基因组组分分析,如GC含量分析、GC skew分析和密码子偏好性分析。在基因组比较分析中,不仅包括基本的基因组特征比较,还包括分子系统发生分析的内容,即对序列进行相似性比较,以推测序列间的亲缘关系,从而构建进化树。 2003年11月,TIGR公布的黄色粘球菌DK1622(Myxococcus xanthus DK1622)基因组序列不含有注释信息,为了在重要功能基因的研究中抢占先机,我们对其进行了注释工作并做了相应的基因组序列分析,以此搭建微生物基因组序列的分析平台。 我们用Glimmer程序对DK1622的分析结果是查找到9314个ORF,并通过本地blast以及模式查找对ORF进行功能注释。在所有预测出的ORF中,去除了彼此之间有重叠的、短于90个氨基酸残基且功能未知的,以及一些移码的ORFs,从最初预测的9314个ORF中确定了7885个。从这7885个ORF中还可挑选出某些功能基因做下一步的研究。另外,我们对DK1622在全基因组范围内做了GC含量的分析,找到了8个特异区域。DK1622全基因组的GC skew图非常对称的,这与它的复制方式有关。我们还对DK1622所有预测的基因做了密码子偏好性分析,得到了DK1622的最优密码子集。从分析中可以大致看出DK1622是一种密码子偏好性很强的菌种,而且功能越重要的基因密码子偏好性越强。 TAIL PCR是一种利用引物的热不对称性来分离已知序列侧翼未知序列的重要方法,由于其操作简单,高效灵敏等诸多优点,目前已被广泛使用。TAIL PCR中,随机兼并(AD)引物起了关键性的作用。现有的AD引物主要是靠经验摸索而来,广泛应用于动植物,对于基因组GC含量分布广、碱基组成差异大的微生物的效率较低。 为了提高TAIL PCR在微生物中的效率,规范AD引物的设计思路,我们在进行微生物基因组序列分析过程中,提出新型AD引物的设计思路。我们将AD引物分成3个部分,每一部分都是从在基因组中的高频率出现的寡核苷酸中挑选出来的,3个部分要满足Tm值限制、结构限制和碱基分布限制三大限制条件,然后才将其组装起来。我们根据301个已测序微生物基因组序列设计出301套相应的AD引物,并构建了相应的微生物AD引物数据库(ADDB)。每套AD引物都可应用于亲缘关系较近或GC含量相近的菌株。 根据已测序的Myxococcus xanthus DK1622基因组设计的一套AD引物,用于Myxococcus fulvus strain HW-1(同属),Sorangium spp(近缘)和Streptomyces griseus(GC含量相近)的TAIL PCR,已被验证效率很高。根据已测序的Pseudomonas aeruginosa PAO1基因组设计的AD引物,用于一株未知的Pseudomonas spp,已被验证高效。 该工作的完成不仅提供了AD引物设计的新思路、新方法,更极大简化了相关研究中繁琐、盲目的引物筛选工作,从而有效解决了TAIL PCR在微生物中的应用瓶颈。不足之处是数据库的冗余度偏高,且缺乏足够多的实验证据。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张松;黄波;夏学峰;孙之荣;;蛋白质亚细胞定位的生物信息学研究[J];生物化学与生物物理进展;2007年06期
2 程鹏;黄志刚;洪亚辉;刘霞;萧浪涛;王若仲;;植物激素相关核酸和蛋白质二级数据库的构建与应用[J];植物学报;2010年02期
3 郭荣;尹京苑;杨立桃;张大兵;;转基因生物相关平台的构建[J];生物信息学;2010年04期
4 姚琳;郭东林;;PKS-NRPS数据库的研究进展[J];中国农学通报;2009年16期
5 张光亚,方柏山;代谢途径数据库简介[J];生物学通报;2003年10期
6 张震;李军利;;机器学习方法及其在生物信息学中的应用[J];吉首大学学报(自然科学版);2006年04期
7 叶雄;张楚富;;生物信息学在植物谷氨酰胺合成酶同工酶基因研究中的应用[J];植物生理学通讯;2006年01期
8 刘蓉;刘军万;;生物信息学中途径研究进展[J];生物技术通报;2008年01期
9 张震;刘兴平;;机器学习技术在生物信息挖掘中的方案探讨[J];广西民族学院学报(自然科学版);2006年01期
10 陈永对;;生物信息学在基因组和蛋白质研究中的应用[J];中国临床康复;2006年41期
11 郑澜,陆爱云;生物信息学在运动能力候选基因研究中的应用策略[J];中国运动医学杂志;2004年06期
12 张敏辉;高晓玲;;基于生物信息学数据库的研究与应用[J];中国科技信息;2010年22期
13 王雅琴;康峰;;生物信息学及其在动植物育种工作中的应用[J];当代畜牧;2006年02期
14 刁雪涛;张小芳;宋洁;金梅;;生物信息学研究进展[J];安徽农学通报;2008年22期
15 李鸥;;生物信息学:生物科学与计算机结合的新学科[J];高等教育研究;2005年03期
16 欧阳平;;生物信息数据库与序列分析[J];生物学通报;2007年01期
17 石鸥燕;杨文万;;基于Entrez系统利用生物信息数据库[J];医学信息;2007年02期
18 马宝林;李夏兰;宋宝珍;;抗菌肽数据库简介[J];生物学通报;2007年05期
19 ;生物信息学试题答案(2)[J];外科理论与实践;2007年04期
20 汪德正,谢建明,徐立臻,董逸生,孙啸;基因调控信息集成数据库及查询[J];计算机与应用化学;2004年05期
中国重要会议论文全文数据库 前10条
1 葛剑徽;李成;谢迅雷;;生物信息学发展现状与前景展望[A];2008年中华临床医学工程及数字医学大会暨中华医学会医学工程学分会第九次学术年会论文集[C];2008年
2 孙琳琳;蒋继志;;生物信息学及其在作物抗性基因研究中的应用[A];中国植物病理学会2006年学术年会论文集[C];2006年
3 杨长平;;生物信息学在畜禽基因组研究中的应用[A];中国农业信息科技创新与学科发展大会论文汇编[C];2007年
4 朱云平;刘湘军;魏丽萍;李亦学;;肝脏蛋白质组的生物信息学研究[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
5 徐静;谷雪梅;张昊;孟贤;来茂德;;基于NCBI EST数据库的结直肠癌相关基因大规模电子筛选[A];中华医学会病理学分会2005年学术年会论文汇编[C];2005年
6 李亮;朱庆;;家鸡核糖体蛋白基因RPS13的电子克隆及鉴定[A];中国家禽业——机遇与挑战——第十三次全国家禽学术讨论会论文集[C];2007年
7 柯涛;毛晗;董彩华;郭学兰;黄思良;刘胜毅;;油菜抗菌肽基因的生物信息学分析[A];中国植物病理学会2009年学术年会论文集[C];2009年
8 果德安;;蛋白质组学技术在中药研究中的应用[A];中医药中青年科技创新与成果展示论坛论文集[C];2009年
9 果德安;;蛋白质组学技术在中药研究中的应用[A];自主创新与持续增长第十一届中国科协年会论文集(3)[C];2009年
10 王琴;涂长春;黄保续;范学政;郭焕成;盖华武;高光;江禹;李金花;徐和敏;徐璐;兰广义;温磊;王在时;赵耘;赵启祖;宁宜宝;沈青春;宋立;;猪瘟流行病学信息系统(CSF info)的建立及应用[A];中国畜牧兽医学会2006学术年会论文集(下册)[C];2006年
中国博士学位论文全文数据库 前10条
1 肖庆;硬粒小麦硒蛋白的生物信息学研究[D];华中科技大学;2008年
2 杜伟;机器学习及数据挖掘在生物信息学中的应用研究[D];吉林大学;2011年
3 沈霞;小鼠及人顺式作用元件CArG序列特征及进化研究[D];西北农林科技大学;2009年
4 李艳芸;HLA-DRB1基因编码区SNPs的分析及其与宫颈癌的相关性研究[D];天津医科大学;2006年
5 金科;生物信息学在大熊猫和血吸虫基因组分析中的应用[D];复旦大学;2010年
6 徐卓菲;胸膜肺炎放线杆菌和猪瘟病毒的基因组测序与比较基因组学研究[D];华中农业大学;2008年
7 张敏;生物信息学中多序列比对等算法的研究[D];大连理工大学;2005年
8 贾宁凤;基于AnnAGNPS模型的黄土高原小流域土壤侵蚀和养分流失定量评价[D];中国农业大学;2005年
9 曾智勇;猪呼肠孤病毒SC-A株的分离鉴定及全基因组cDNA文库的构建和分子遗传特征分析[D];四川农业大学;2006年
10 杨龙;利用cDNA/EST序列大规模开发内含子多态性标记的研究[D];浙江大学;2008年
中国硕士学位论文全文数据库 前10条
1 周光涛;M.xanthus DK1622基因组序列分析及新型随机兼并引物数据库的构建[D];山东大学;2007年
2 高哲;基于PWMSA算法拟南芥协同基因调控的预测[D];吉林大学;2009年
3 潘志宏;植物化感作用代谢途径模拟预测系统的构建与应用[D];福建农林大学;2009年
4 章文蔚;马铃薯microRNA的鉴定及分析[D];南昌大学;2007年
5 肖智权;帕金森病相关蛋白质相互作用网络的构建[D];中南大学;2008年
6 赵玄之;超级杂交稻母本株1S CHLH cDNA的生物信息学分析与克隆[D];湖南农业大学;2008年
7 匡刚桥;鳜鱼微卫星标记的开发及遗传多样性研究[D];湖南农业大学;2007年
8 王华;类风湿关节炎患者HLA-Ⅱ类基因SNP的初步研究[D];江苏大学;2009年
9 李红燕;基于BLAST算法的序列分析软件开发[D];中南大学;2009年
10 何瑶;改进免疫算法在生物序列比对中的应用研究[D];燕山大学;2006年
中国重要报纸全文数据库 前10条
1 本报记者 李恩青;生物信息学:促动BT与IT双赢[N];中国高新技术产业导报;2001年
2 刘义;生物信息学产业浮出水面[N];中国高新技术产业导报;2000年
3 英潮;生物信息学演绎“变脸”[N];中药报;2002年
4 中科院院士 强伯勤;生物信息学蕴有巨大效益[N];光明日报;2002年
5 白毅;加强生物信息学建设推动人类基因组研究[N];中国医药报;2002年
6 周颖;李梢:生物信息学为证候研究提供新视角[N];中国中医药报;2006年
7 中国科学院院士 张春霆 郝柏林;生物信息学孕育大产业[N];经济日报;2000年
8 刘丽丽;高性能计算为生物信息学加速[N];计算机世界;2007年
9 严飞;生物信息学 新世纪的新科学[N];大众科技报;2002年
10 本报记者 张荔子;生物信息学——解读“天书”的钥匙[N];健康报;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978