收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

林木基因组大数据分析及应用

王雪霖  
【摘要】:随着大规模测序工作的广泛开展和新一代测序技术的大量应用,完成测序的生物序列及相关信息越来越多,如何挖掘生物基因组序列中存在的有用信息是生物信息学研究人员需要面对的一个关键问题。基因测序实验获得巨大数目的碱基仅仅是获得基因组序列的子序列集合,绝大多数高等生物的基因组序列无法一次性获取,因此需要利用计算机算法和相应软件来指导基因组序列拼接(Assembly Genome Sequence),并运用生物信息方法对拼接后的基因组中的有效信息进行挖掘,本文针对测序数据纠错、基因组装配及基因家族鉴定出三类算法,主要工作概述如下:1.出了一种改进的IKNN(Improved KNN)算法,以第二代测序的短片段对应的样本集和第三代测序的长片段对应的测试集为输入,设置最优的K值将短片段比对到长片段上,通过组装匹配上的短片段完成对长片段的纠错。第二代测序技术作为现阶段主要的生产化平台,主要优点是能产生高通量和高准确率的测序数据,但其产生的测序序列reads长度较短;目前逐步发展起来的的第三代测序技术,产生的测序数据reads长度较长,但是第三代测序技术产生的测序数据准确率低(约为86%),设计算法及软件对这些长reads进行纠错是第三代测序数据处理的必要操作。IKNN算法根据与待分类样本相近邻的K个样本类别来对拟分类样本进行分类,不仅可以完成对第三代测序数据的纠错,基于该算法还能设计出一种混合纠错拼接算法,最终获得高效率、高准确率的目标基因组序列。2.出了一种基于二三代数据混合组装的LSA(Long reads and Short reads Assembly)算法。第二代测序技术产生了大量的测序数据,对此研发了许多基因组拼接软件,是目前较成熟的获得完整基因组的方式。但是由于大部分基因组具有重复片段多,杂合度高,产生分支多等特点,当组装基因组的过程中遇到以上一种或几种情况时,为了后续正确路径的选择以装配高精度的基因组序列设计了LSA算法。LSA算法原理为在进行组装高准确率的第二代测序序列的过程中,借助三代数据长序列用于指导装配路径,这样不仅能为出现分支选择路径,而且能避免由于没有路径指导无法继续组装的问题。本文利用该方法成功组装出林木植物中的枣树叶绿体、盐芥和簸箕柳线粒体基因组(NCBI登录号为:KU351660,KT988071,NC029317.1),并进一步分析了这三种植物细胞器基因组的结构及功能,为未来植物细胞器研究供了重要的参考。3.出了一种基于HMM算法的转录因子家族鉴定算法,设计出一套基于功能分析的通用流程。转录因子家族主要用于调节细胞代谢和植物发育,他们通过编码获得的产物具有重要的作用。运用该算法与功能分析流程挖掘出15个簸箕柳WOX基因家族成员,这些成员在茎和根顶端分生区干细胞的维持、侧生器官的发育、花器官的形成和胚发育等方面担当重任;对簸箕柳WOX基因家族进一步的序列分析、染色体定位、结构和模体定位、系统发育学分析、表达谱分析等功能分析,有利于揭示基因物种分化,演化历史和基因功能,为研究转录因子在植物抵抗不良环境的影响和生长发育中的作用奠定基础。


知网文化
【相似文献】
中国期刊全文数据库 前18条
1 ;韩国完成迄今最大规模人类基因组分析[J];中国科技产业;2010年04期
2 ;基因组分析具有临床应用价值[J];分子诊断与治疗杂志;2010年04期
3 王明伦;;嗜人B淋巴细胞病毒的基因组分析[J];国外医学(卫生经济分册);1988年01期
4 李伟;不用比较的基因组分析[J];世界科学;2004年06期
5 江世亮;;赵寿元教授谈“人的基因组分析”[J];世界科学;1992年05期
6 黄蓉婷;吉国力;吴小惠;;全基因组分析单核苷酸多态性对多聚腺苷化信号的影响[J];生命科学仪器;2016年Z2期
7 余光创;秦宜德;;miRNA靶基因计算分析新方法及其应用研究[J];安徽医科大学学报;2011年05期
8 郭凯声;;人类基因组分析研究在日本的进展[J];世界研究与发展;1991年05期
9 周仲儿;猪基因组分析现状[J];浙江畜牧兽医;1999年02期
10 远滕;王维荣;;人类基因组分析系统[J];世界科学;1992年05期
11 徐宁迎;奶牛基因组分析研究进展[J];中国奶牛;2000年01期
12 郭春沅;基于cDNA测序与杂交的大规模基因组分析方法[J];生物学通报;2001年08期
13 张广军;基因组分析促进解决血吸虫分子之谜[J];国外医学(寄生虫病分册);2000年05期
14 曾嘉丽;欧阳林娟;刘家林;贺浩华;朱昌兰;彭小松;贺晓鹏;傅军如;陈小荣;边建民;徐杰;孙晓棠;周大虎;胡丽芳;;水稻PAL基因的全基因组分析及胁迫表达研究[J];基因组学与应用生物学;2018年09期
15 郑媛媛;;人单个卵母细胞的基因组分析[J];中国病理生理杂志;2014年06期
16 宋文源;朱立煌;;Alu-PCR及其在人类基因组分析中的应用[J];国外医学(分子生物学分册);1992年01期
17 ;英国成立基因组分析中心,重点发展民生科技[J];中国科技信息;2009年16期
18 A.D’Hont,L.Grivent,C.Asnaghi,张琼;甘蔗基因组分析的进展[J];甘蔗糖业;1999年05期
中国重要会议论文全文数据库 前10条
1 杨晓雯;李亚杰;臧娟;李叶霞;别鹏飞;吕艳丽;吴清民;;利用泛基因组分析布鲁氏菌核心基因和必需基因[A];中国畜牧兽医学会动物传染病学分会第九次全国会员代表大会暨第十七次全国学术研讨会论文集[C];2017年
2 施定基;;微藻系统组生物学的研究[A];中国海洋湖沼学会藻类学分会第七届会员大会暨第十四次学术讨论会论文摘要集[C];2007年
3 黄发新;白石进;;适合于林木基因组分析的RAPD改进法(RAPD+sp)技术研究[A];第二届中国林业学术大会——S2 功能基因组时代的林木遗传与改良论文集[C];2009年
4 冯杰;王剑;唐兵;唐晓峰;;极端嗜盐古菌Natrinema sp.J7-2全基因组分析[A];2012年鄂粤微生物学学术年会——湖北省暨武汉微生物学会成立六十年庆祝大会论文集[C];2012年
5 冯杰;王剑;唐兵;唐晓峰;;极端嗜盐古菌Natrinema sp.J7-2全基因组分析[A];2012年第五届全国微生物遗传学学术研讨会论文摘要集[C];2012年
6 贺红霞;李楠;朱旭;李传龙;杨明贺;;马铃薯基因组编辑技术的研究进展及应用前景[A];马铃薯产业与脱贫攻坚(2018)[C];2018年
7 王冕;郝晓萌;胡媛媛;谭亿;王以光;甘茂罗;肖春玲;;基因组分析指导的海洋链霉菌IMB3-202活性物质的发现[A];第十三届全国抗生素学术会议论文集[C];2017年
8 黄军艳;韩冬梅;喻子牛;孙明;;苏云金芽胞杆菌拟步行甲亚种YBT-1765质粒pBMB175的基因组分析[A];第二届中国青年学者微生物遗传学学术研讨会论文集[C];2006年
9 郭先霞;;水稻抗病基因克隆方法及同源类似物全基因组分析[A];中国植物病理学会2006年学术年会论文集[C];2006年
10 刘大钧;;基因组分析与小麦抗病育种[A];农业科技创新与生产现代化学术研讨会论文集[C];2001年
中国博士学位论文全文数据库 前8条
1 王嘉博;全基因组关联分析方法的拓展以及实用分析工具软件的建立[D];东北农业大学;2018年
2 金科;生物信息学在大熊猫和血吸虫基因组分析中的应用[D];复旦大学;2010年
3 朱康丽;鲸类味觉的丢失及鲸类适应性进化的比较基因组学分析[D];南京师范大学;2016年
4 蔡晓锋;番茄Dof基因家族全基因组分析及SlDof22、SlDHAR1和FaGalUR在AsA积累中的功能分析[D];华中农业大学;2014年
5 胡泉军;牦牛基因组数据库建设[D];兰州大学;2014年
6 刘玉芬;鸡传染性支气管炎病毒国内分离株基因组的研究[D];东北农业大学;2003年
7 赵国昌;永久性心房颤动的基因组DNA甲基化分析[D];首都医科大学;2017年
8 杜瑾;基于基因组分析的VC发酵混菌体系共生机制及功能强化[D];天津大学;2013年
中国硕士学位论文全文数据库 前10条
1 王雪霖;林木基因组大数据分析及应用[D];南京林业大学;2018年
2 解秀月;牦牛基因组有害突变积累研究[D];兰州大学;2018年
3 李净净;Bacillus sp.LM4-2分离鉴定与全基因组分析[D];河南科技大学;2015年
4 唐靖伟;Mucilaginibacter pedocola sp.nov.的多项分类学鉴定和基因组分析[D];华中农业大学;2017年
5 包永红;基于Hadoop的基因组分析平台构建[D];内蒙古大学;2015年
6 成竞梁;转录因子结合位点和遗传病基因突变的全基因组分析[D];湖南科技大学;2012年
7 李家红;抗重金属型锰矿假氨基杆菌JH-7~T的多相分类学鉴定和基因组分析[D];华中农业大学;2017年
8 陈露;乡村农研丝杆菌Niastella vici sp.nov.的新种鉴定及基因组分析[D];华中农业大学;2017年
9 余光创;miRNA靶基因计算分析新方法及其应用研究[D];安徽医科大学;2009年
10 包远远;矿物风化细菌的生物学特性和Dyella jiangningensis SBZ3-12全基因组分析[D];南京农业大学;2015年
中国重要报纸全文数据库 前10条
1 记者 张梦然;高质量向日葵基因组“来了”[N];科技日报;2017年
2 本报记者 王洪磊 通讯员 孙哲;中德合作开创多倍体复杂基因组分析先河[N];山东科技报;2017年
3 记者 张梦然;迄今最详细的人类基因组分析数据出炉[N];科技日报;2012年
4 薛严;迄今最大规模人类基因组分析完成[N];科技日报;2010年
5 记者 赵汉斌;小麦A基因组序列精细图谱完成[N];科技日报;2018年
6 记者 白毅;两种猴基因组分析揭示遗传差异重要性[N];中国医药报;2011年
7 杨慧宁 于宛平;首次基因组分析有助认识巴西寨卡病毒暴发[N];医学参考报·灾害救援医学频道;2016年
8 记者 赵汉斌;基因组分析揭示等位基因特异RNA编辑现象[N];科技日报;2018年
9 ;“液体活检”有望用于癌症筛查[N];科技日报;2016年
10 记者 林小春;美将投10亿美元启动抗癌重大计划[N];科技日报;2016年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978