收藏本站
收藏 | 论文排版

基于RNA测序技术的转录组从头拼接算法研究

常征  
【摘要】:生物信息学是一门新兴的交叉学科,它利用数学、信息学、统计学和计算机科学的方法来研究和解决生物学的问题。当前生物信息学所研究的问题主要集中在分子生物学领域,其中一个非常重要而又极具挑战性的问题就是转录组的从头拼接,即利用转录组的测序片段来拼接出整个转录组中的所有表达的转录体。本文主要研究如何利用经典的组合优化模型来解决复杂真核生物转录组的从头拼接问题,这对于研究包括癌症在内的许多与可变剪接相关的人类疾病,具有十分重要的意义。 随着第二代测序技术的发展,特别是RNA测序(RNA-seq)的出现,给转录组的拼接在计算上提出了前所未有的挑战。目前的转录组的拼接算法主要分为两大类,一类是基于参考基因组的拼接方法,一类是从头拼接方法。尽管基于参考基因组的方法比从头拼接方法表现要好,但是它的一个致命的缺点是必须要有一个高质量的参考基因组。而事实上,绝大多数生物根本不存在一个已知的基因组可供参考,在这种情况下,从头拼接算法就显得尤为重要。转录组的从头拼接比基于参考基因组的拼接在计算上更具有挑战性,尽管目前已经有了一些算法,但是效果并不理想。 本文在分析当前拼接算法的基础上,提出了一个全新的转录组从头拼接算法(命名为Bridger),巧妙地利用基于参考基因组算法的一些技巧来弥补目前从头拼接算法的不足。在狗、人和老鼠的RNA测序数据上的测试结果一致表明,Bridger比当前所有的从头拼接算法都要好。Bridger拼接出了更多的全长的转录体,而给出的候选转录体的数目却很少,暗示着Bridger不仅提高了从头拼接算法的敏感性,也大大降低了预测结果中的假阳性。另外,在时间和内存的使用方面,Bridger也比绝大多数从头拼接算法要少很多。更有意思的是,Bridger在敏感性和准确性上甚至可以跟当前最好的基于参考基因组的算法Cufflinks相媲美。 本文的新算法Bridger主要有以下几个创新点:(1)放弃了通常使用的deBruijn图,由RNA的测序片段来直接构建一个能更好地反映出每一个基因可变剪接结构的图——剪接图。(2)构造图的过程中利用双端测序的信息,不仅使得到的剪接图更加准确、完整,而且有效地控制了图的规模,从而降低了在图中寻找对应转录体的路的难度。(3)通过引进一个辅助图——兼容图,成功地将一个经典的组合优化模型——最小路覆盖模型——应用到转录组的从头拼接中,相比于以前的穷举方法,可以大大降低结果的假阳性。(4)通过给模型加权,巧妙地将测序的深度信息整合到模型中,大大提高了拼接的准确性,据我们所知,这是测序的深度信息第一次被成功地用在从头拼接算法中。 尽管Bridger算法有很多优点,但是也存在不足。第一,当前的Bridger的代码实现还有待进一步优化,在构造剪接图的过程中实现并行化计算是我们的一个努力方向。第二,算法中的最小路覆盖模型,并不是对于任何情况都非常有效,有些比较特殊例子,该模型也表现不太理想,这时可以通过一些技巧来克服算法的不足。 本文通过两个例子展示了Bridger在实际应用中重要价值。一个例子是利用Bridger对肺癌病人的RNA测序数据进行分析,发现了与致癌基因相关的可变剪接转录体以及它们在不同样本中的表达差异。另一个例子是利用Bridger分析狗的RNA测序数据,发现了很多当前基因组中尚未注释的新的转录体。最后,本文还介绍了转录组拼接下游的一些研究工作以及我们今后的几个研究方向。 Bridger已经用C++语言实现成一个开源的软件,可以通过以下网址下载:https://sourceforge.net/projects/rnaseqassembly/files/?source=navbar


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘明奇;倪国强;陈小梅;;基于信息熵和灰度相关的图像拼接算法[J];光学技术;2007年S1期
2 韩越兴,刘秀平,施锡泉;Loop细分模型的边界拼接算法[J];大连理工大学学报;2004年01期
3 刘刚;袁纪武;李磊;王伟强;;基于局部体积最大的轮廓线三维形体重构算法[J];山东科技大学学报(自然科学版);2011年03期
4 王孝坤;张学军;;子孔径拼接检测非球面的初步研究[J];光学技术;2006年05期
5 逯雯雯;卢志远;王亚旭;孙啸;;面向新一代基因组测序技术的序列拼接算法[J];生物信息学;2010年03期
6 侯溪;伍凡;杨力;吴时彬;陈强;;以环形子孔径法检测大口径非球面主镜的研究进展[J];强激光与粒子束;2006年05期
7 林娟;;大口径光学玻璃光学均匀性干涉绝对测量方法[J];应用光学;2008年01期
8 曾晶;李新南;;大口径快焦比凸双曲面拼接检测方法研究[J];天文研究与技术;2009年02期
9 骆志刚;方小永;丁凡;;DNA序列拼接的研究进展及挑战[J];计算机工程与科学;2007年08期
10 彭祎帆;李海峰;刘旭;李帅;;基于视场拼接的全视差三维显示系统[J];光子学报;2011年09期
11 祁超,张红军;虚拟环境的构造及漫游系统设计研究[J];陕西师范大学学报(自然科学版);2002年04期
12 侯溪,伍凡,吴时彬,陈强;使用环形子孔径拼接检测大口径非球面镜[J];光学技术;2005年04期
13 李军;NURBS曲面G~2光滑拼接算法[J];山西师范大学学报(自然科学版);2005年03期
14 舒硕果;李虎保;谈国军;;一种基于特征点匹配的自动拼接算法[J];科技信息;2007年08期
15 王娇颖;陈卫东;李良福;;一种基于特征不变描述的图像无缝拼接算法[J];应用光学;2011年01期
16 童晓冲;吴云东;王慧;张永生;;大面阵CCD影像多通道不一致性消除算法[J];测绘学报;2006年03期
17 吴宪祥;郭宝龙;王娟;;基于相位相关的柱面全景图像自动拼接算法[J];光学学报;2009年07期
18 郭丙轩;王文进;刘波;王铁程;;一种基于网格的数码相机数字化图像纠正拼接算法[J];测绘科学;2007年06期
19 张赢;汪荣峰;廖学军;;数字地图图幅接边的虚拼接算法[J];计算机工程与设计;2010年16期
20 徐洪艳;鲜浩;张雨东;;利用环形子孔径哈特曼-夏克斜率数据复原全孔径波前相位算法研究[J];光学学报;2011年01期
中国重要会议论文全文数据库 前10条
1 ;应用于航空影像的一种新的灰度投影图像拼接算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
2 李从利;薛模根;冷晓艳;卢伟;袁广林;;基于空中侦察序列图像拼接算法的性能评估方法[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
3 蔡毅;骆志刚;;DNA序列拼接算法分析及并行化探讨[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
4 罗如为;陈孝威;;360°图像序列的柱面全景拼接算法[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
5 侯溪;伍凡;杨力;吴时彬;陈强;;大口径非球面镜的环形子孔径检测技术研究[A];2004全国光学与光电子学学术研讨会、2005全国光学与光电子学学术研讨会、广西光学学会成立20周年年会论文集[C];2005年
6 夏倩;陈孝威;;基于局部熵差的全景图实现技术研究[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
7 韩伟东;许端清;何海涛;;基于块的L-邻域搜索纹理合成算法[A];第十二届全国图象图形学学术会议论文集[C];2005年
8 葛诚;贾云得;刘鹏;彭启民;;基于多域分析和全局优化的鲁棒全景图拼接[A];中国宇航学会深空探测技术专业委员会第一届学术会议论文集[C];2005年
9 甘玲;郑一帆;;基于改进的模板匹配的图像拼接算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
10 肖甫;吴慧中;肖亮;汤杨;;基于光照调整和特征曲线的全景图拼接[A];全国第13届计算机辅助设计与图形学(CAD/CG)学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 常征;基于RNA测序技术的转录组从头拼接算法研究[D];山东大学;2014年
2 李孟;三维表面数字拼接算法研究[D];哈尔滨工业大学;2009年
3 张效栋;便携式数字相位光栅投影全貌测量系统的研究[D];天津大学;2007年
4 蔡润彬;地面激光扫描数据后处理若干关键技术研究[D];同济大学;2008年
5 胡社教;基于图像绘制的遥操作虚拟环境构建技术研究[D];中国科学技术大学;2006年
6 陈善勇;非球面子孔径拼接干涉测量的几何方法研究[D];国防科学技术大学;2006年
7 赵语;地面农业遥感平台在能源作物生物量监测中的研究与应用[D];东北农业大学;2012年
8 王长缨;时态GIS若干关键技术的研究[D];西北大学;2006年
9 鲁恒;利用无人机影像进行土地利用快速巡查的几个关键问题研究[D];西南交通大学;2012年
10 周朗明;微(小)型物体视觉测量与重构方法研究[D];武汉大学;2013年
中国硕士学位论文全文数据库 前10条
1 金士玲;无人机可见光图像拼接算法的研究[D];辽宁大学;2012年
2 高进;基于MapReduce的DNA序列拼接算法研究[D];北京交通大学;2012年
3 欧书琴;全景图像的拼接算法[D];安徽大学;2010年
4 刘海松;一种基于SIFT的拼接算法[D];南京理工大学;2012年
5 任宏;三维场景建模中像片拼接算法与应用研究[D];太原理工大学;2004年
6 刘韬;MPEG-2码流拼接算法的研究与实现[D];电子科技大学;2003年
7 付金红;柱面全景图像拼接算法的研究[D];哈尔滨理工大学;2005年
8 王东阳;DNA序列拼接中deBruijn图结构的研究[D];哈尔滨工业大学;2011年
9 邱风;基于de Bruijn图的短序列拼接算法的优化及并行化[D];中南大学;2013年
10 蒋维华;多跳Ad Hoc网络中实现语音通信的技术研究[D];电子科技大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978