收藏本站
《华南理工大学》 2015年
收藏 | 手机打开
二维码
手机客户端打开本文

使用多种模拟和真实数据对常用的RNA-seq比对软件的测试与综合比较

田巍  
【摘要】:RNA-seq测序技术起始于2008年,其原理是随机获得某样本的反转录cDNA序列,通过组装或与参考序列比对的方法,获得该物种转录组的序列信息和基因表达信息。在多年的发展过程中,RNA-seq测序技术帮助科学家解决了大量转录层面的科研问题,比如特定性状对应的某个或某些基因的差异表达、基因融合和可变剪切事件、碱基编辑、新转录本的组装和注释等。近几年基于RNA-seq测序技术的lncRNA和环状RNA测序技术也受到了广泛的关注,为解读生命过程提供了新的思路。RNA-seq测序技术目前已经十分成熟,测序通量和读长也明显增加:2008年RNA-seq测序技术一个run只能获得几万条25-40bp长度的序列,随着高通量测序技术的迅猛发展,如今我们可以从一个run当中获得几亿甚至几十亿条长度为100bp甚至更长的序列。与DNA测序序列不同,RNA序列的比对通常面临两个挑战:RNA-seq序列经常跨越较长的内含子序列;另外,目前较常用的hiseq2000的序列长度为100bp,hiseq2500和hiseq4000则更长,如此长的序列会跨越两个或多个外显子,增加了比对的难度。同时,转录中大量出现的碱基编辑、indel、可变剪接和融合基因事件也对各种比对软件的比对能力提出了更高的要求。RNA-seq测序技术的信息分析方法开始于将测序读长比对到参考序列,从而将测序序列定位回到其来源的基因组区域[1,2]。在这个过程中比对软件的好坏往往成为整个项目是否成功的前提条件。在大多数的比对过程中,评价比对效果的因素主要有三种:比对速度、对计算机硬件(主要为内存)的需求和比对精度。目前国内科研和生产过程中应用于RNA-seq测序序列的比对软件主要有SOAP、BWA、Tophat等,暨南大学的张弓教授也组织开发了一款基于windows系统的比对软件Fanse2,相应发表的文章中认为此软件无论从比对速度、对系统的要求还是比对精度方面都具有明显优势,以此也可以看出我国在生物信息领域的进步非常迅速。目前针对RNA-seq各比对软件的比较研究有Brian J Haas[3],Garber M[4]和Kvam VM[5]等的研究结果,但主要都集中在对RNA-seq测序技术方法综述和对基因表达统计方法的比较上,2015年Steven Salzberg发表在Nature Methods的论文中比较了Hisat与其他三款不同的比对软件,认为Hisat相对于其他软件来讲速度更快,比对精度更高。但Steven Salzberg的比较中不包括SOAP、BWA等国内常用的软件。本实验在Steven Salzberg的研究基础上,分别使用无错配、有错配、有indel三种模拟数据和真实测序数据,综合比较了8种软件在比对速度、比对精度和对计算机要求中的表现,结果表明Hisat和STAR在比对速度上具有优势,同时Hisat在比对精度上明显高于其他软件,内存消耗也最小。总体来看,Hisat的综合实力最强。对只含有一个外显子的序列测试表明,在含有mismatch和indel错配的序列比对中,Fanse2都有最好的比对效果,更适合于寻找基因的表达量和鉴定snp及indel。为讨论基因组大小和重复度的高低对比对软件的影响,本实验同时使用人和线虫作为参考序列,比较不同软件的运行效率,从比对结果中发现,当基因组大小和重复度变化时,比对结果并未收到明显影响。本研究使用不同的测试数据,从不同使用角度出发,分别对8种国内外科研和生产中常出现的用于RNA-seq测序序列的比对软件进行比较,为以不同目的和结果的科研和生产过程提供新思路和实践性的参考。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:Q811.4

【相似文献】
中国期刊全文数据库 前5条
1 王颖;刘麟;;一种基于RNA-Seq的基因组注解评估方法[J];科学通报;2013年33期
2 周超平;李鑫辉;;单细胞转录组研究进展[J];生物化学与生物物理进展;2013年12期
3 赵霞;陈灿煌;倪青山;王竞;胡福泉;谭银玲;;通过RNA-seq初步考察铜绿假单胞菌噬菌体PaP3对宿主转录组的全局性调控[J];免疫学杂志;2013年04期
4 兰道亮;熊显荣;位艳丽;徐通;钟金城;字向东;王永;李键;;基于RNA-Seq高通量测序技术的牦牛卵巢转录组研究:进一步完善牦牛基因结构及挖掘与繁殖相关新基因[J];中国科学:生命科学;2014年03期
5 ;[J];;年期
中国重要会议论文全文数据库 前3条
1 赵西西;王成成;陈国华;林剑青;贺竹梅;;RNA-Seq揭示黄曲霉胞内氧化还原反应与黄曲霉毒素合成的关系[A];中国遗传学会第九次全国会员代表大会暨学术研讨会论文摘要汇编(2009-2013)[C];2013年
2 张玉刚;祝军;梁美霞;戴洪义;;利用RNA-Seq分析柱型和普通型苹果转录水平差异[A];中国园艺学会2011年学术年会论文摘要集[C];2011年
3 于安民;杨锦芬;;基于RNA-seq的阳春砂果实可溶性糖及萜类代谢的基因表达谱分析[A];生态文明建设中的植物学:现在与未来——中国植物学会第十五届会员代表大会暨八十周年学术年会论文集——第4分会场:资源植物学[C];2013年
中国博士学位论文全文数据库 前2条
1 李雪艳;基于RNA-Seq的兰州百合鳞茎淀粉-蔗糖代谢关键酶SuSy和INV基因的挖掘[D];沈阳农业大学;2015年
2 梁书利;基于RNA-Seq技术的毕赤酵母转录组学研究及其表达元件的挖掘[D];华南理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 田巍;使用多种模拟和真实数据对常用的RNA-seq比对软件的测试与综合比较[D];华南理工大学;2015年
2 石文芳;基于RNA-seq测序的梅花转录组分析[D];北京林业大学;2012年
3 毛笈华;利用RNA-seq技术挖掘胡萝卜抽薹开花相关基因[D];中国农业科学院;2013年
4 苏山春;基于RNA-seq技术对鼠疫耶尔森氏菌小RNA的筛选与鉴定[D];四川农业大学;2013年
5 于安民;基于RNA-Seq的阳春砂果实发育过程中糖和萜类代谢的研究[D];广州中医药大学;2014年
6 张莉华;基于RNA-Seq技术的尼古丁影响下大鼠大脑中的基因表达研究[D];天津医科大学;2014年
7 赵晓俊;对羟基苯甲酸乙酯对雄果蝇的生殖毒性及其基于RNA-seq的DGE分析[D];陕西师范大学;2014年
8 张清瑞;基于RNA-Seq的DHAV-1感染雏鸭的组织转录组分析[D];华中农业大学;2013年
9 李娜;基于RNA-Seq技术筛选的功能性融合转录本TSNAX-DISC1与子宫内膜癌发生发展的关联研究[D];苏州大学;2014年
10 亓飞;毕赤酵母AOX1启动子的阻遏因子PpMig1、PpMig2的亚细胞定位及基于RNA-Seq技术的毕赤酵母基因组重注释和比较转录组学初步研究[D];华东理工大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026