收藏本站
收藏 | 论文排版

针对新一代测序技术的序列拼接算法研究

陈传艺  
【摘要】:近年来,新一代测序技术不断涌现和发展。与费用高昂的Sanger测序技术相比,新一代测序技术不仅成本低,而且速度快,为完成更多基因组测序计划提供了可能。然而,新一代测序平台测得的序列片段长度短、数据量大、错误率较高,这给序列拼接带来了严峻的考验。因此,针对新一代测序技术产生的错误率较高的高通量短序列数据,研究高效的数据处理方法和序列拼接算法具有重要的意义。 本文在分析新一代测序技术和现有序列拼接技术的基础上,针对新一代测序数据错误率高的特点以及当前广泛运用于高通量短序列拼接的de Bruijn图拼接技术对测序错误敏感的问题,以提高拼接效果为目标,对新一代测序数据的处理和拼接展开了一定的研究,提出了一种能够有效修正序列片段中错误碱基的测序错误校正方法。该方法首先通过构造后缀数组(suffix array)寻找序列片段的匹配信息,然后通过多序列比对修正序列片段中可能存在的错误碱基。实验结果表明,使用该方法对序列片段进行预处理能够大大提高序列拼接效果。 另外本文针对新一代测序数据数据量的特点以及de Bruijn图序列拼接技术对内存要求较高的问题,以降低序列拼接对内存的要求为目标,提出了一种能够有效降低拼接数据量的序列片段并行聚类方法。该方法对序列片段进行相似性聚类,在聚类过程中采用空位种子索引(spaced seed indexing),具有较高的并行性,容易通过OpenMP实现聚类的并行化,能够大大减小搜索空间和搜索时间。实验结果表明,该方法能够在保证序列拼接效果的前提下对高通量短序列片段进行有效聚类,剔除冗余的序列片段,减少数据量。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 夏永波;;一类新的具有大集合容量的p元低相关序列集[J];中国科学技术大学学报;2011年07期
2 ;封面说明[J];现代生物医学进展;2011年08期
3 ;封面说明[J];现代生物医学进展;2011年13期
4 杨旭;王俊;;2011年第8期《遗传》封面说明[J];遗传;2011年08期
5 ;科学家采用新一代测序技术为人类基因组结构变异检测提供新方法[J];中国科技产业;2011年08期
6 ;小鼠大脑皮层基因活性图谱成功绘出[J];广东农业科学;2011年17期
7 蒋涛;杨蕾;蒋慧;田埂;张秀清;;一种结合单张芯片序列捕获和高通量测序技术测序外显子组的方法[J];中国科学:生命科学;2011年09期
8 ;会议报道[J];中国生物工程杂志;2011年07期
9 赵艳秋;;华大基因模式裂变[J];IT经理世界;2011年15期
10 周钢桥;张学;;基因组学与人类疾病[J];遗传;2011年08期
11 ;科技要闻[J];科技导报;2011年17期
12 李升伟;;基因组医学:过去、现在和将来[J];世界科学;2011年06期
13 张鑫;李敏;张学军;;全基因组外显子测序及其应用[J];遗传;2011年08期
14 马玉韬;车进;刘大铭;;基于傅里叶分析的蛋白质编码区预测中功率谱密度计算方法研究[J];宁夏大学学报(自然科学版);2011年02期
15 程晓凤;黄福江;刘明典;汪登强;;454测序技术开发微卫星标记的研究进展[J];生物技术通报;2011年08期
16 郑艳阳;张凤元;;基于零相关区的最佳重组杂交桥函数序列族设计[J];科技信息;2011年15期
17 赵君;吴小红;陶杰;;一种基于动态博弈的理性交换协议模型[J];计算机应用与软件;2011年07期
18 李晓晖;李鑫鑫;张维;燕永亮;陈明;陆伟;;宏转录组学在微生物生态学研究中的应用[J];中国农业科技导报;2011年04期
19 付畅;黄宇;;转录组学平台技术及其在植物抗逆分子生物学中的应用[J];生物技术通报;2011年06期
20 郑小国;陈亮;楼巧君;罗利军;;表观遗传学研究方法进展[J];生物技术通报;2011年09期
中国重要会议论文全文数据库 前10条
1 杨旭;;新一代测序技术在探索传染病遗传易感性方面的应用[A];新观点新学说学术沙龙文集43:传染病的遗传易感性[C];2010年
2 倪培相;;新一代高通量测序技术在微生物基因组学研究中的应用[A];2010年中国科学院微生物研究所博士后学术年会暨第二届博谊论坛论文摘要集[C];2011年
3 林小涵;李滢;罗红梅;孙超;陈士林;;基于454 GS FLX测序平台的银杏转录组学研究(摘要)[A];全国第9届天然药物资源学术研讨会论文集[C];2010年
4 林小涵;李滢;罗红梅;孙超;陈士林;;基于454 GS FLX测序平台的银杏转录组学研究[A];2010年中国药学大会暨第十届中国药师周论文集[C];2010年
5 杨碧澄;徐达文;;全基因测序技术介绍及其在藻类中的应用[A];庆祝中国藻类学会成立30周年暨第十五次学术讨论会摘要集[C];2009年
6 李晓峰;刘公社;;利用454测序技术大规模挖掘羊草抗逆转录因子的研究[A];中国草学会牧草育种委员会第七届代表大会论文集[C];2009年
7 刘进元;;采用高通量序列分析技术进行植物microRNA的比较组学研究[A];中国生物化学与分子生物学会农业生物化学与分子生物学分会第八次学术研讨会论文集[C];2008年
8 王军一;明瑶;;水产生物基因组学研究进展[A];渔业科技创新与发展方式转变——2011年中国水产学会学术年会论文摘要集[C];2011年
9 陆祖宏;;与疾病相关的SNP筛选以及低成本快速全基因组DNA测序技术[A];中国化学会第十一届胶体与界面化学会议论文摘要集[C];2007年
10 杨刚;吴镝;张娟;张丽芳;马多;蒋丽娜;李梦龙;文志宁;;统计学方法在mRNA-Seq中的应用[A];中国化学会第28届学术年会第14分会场摘要集[C];2012年
中国博士学位论文全文数据库 前10条
1 平捷;高通量测序技术在个性化医疗中的应用[D];上海交通大学;2012年
2 曾慧敏;应用高通量测序研究儿童血液系统疾病发病机制[D];北京协和医学院;2011年
3 王娜;应用新一代测序技术对肾透明细胞癌转录组的研究[D];吉林大学;2012年
4 周正春;低相关序列设计及其相关编码研究[D];西南交通大学;2010年
5 李玉博;准同步码分多址系统扩频序列设计理论研究[D];燕山大学;2012年
6 李滢;基于高通量测序技术的药用植物表达序列标签系统的构建与应用[D];中国协和医科大学;2010年
7 李粤;microRNA深度测序数据分析的生物信息学算法及应用[D];苏州大学;2012年
8 谢为博;基于表达谱芯片和新一代测序技术的高通量基因分型方法的开发[D];华中农业大学;2010年
9 佟鑫;直接序列扩频通信系统中的序列设计[D];北京邮电大学;2008年
10 张璇;准同步CDMA通信系统扩频序列设计[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 陈传艺;针对新一代测序技术的序列拼接算法研究[D];福建农林大学;2012年
2 孙明辉;基于第二代测序技术的小片段组装系统[D];吉林大学;2011年
3 刘元;第二代测序技术对于肝细胞癌的研究[D];第二军医大学;2012年
4 苑建蕊;基于双向de Bruijn图的序列拼接并行化研究与实现[D];中南大学;2012年
5 王丹丹;嗜水气单胞菌胁迫下东北林蛙皮肤转录组Solexa测序及表达谱分析[D];东北林业大学;2012年
6 华蔚颖;应用454测序技术分析菌群结构的方法学研究[D];上海交通大学;2010年
7 王艳;线粒体DNA序列多态性及其在法医学应用的研究[D];山西医科大学;2002年
8 范秀朵;基于高通量Illumina测序技术的干旱胁迫下大豆根和叶mRNA表达谱研究[D];吉林农业大学;2011年
9 范秀静;基于模板DNA的PCR扩增难易预测[D];渤海大学;2012年
10 耿慧超;基于频繁闭词序列集的层次聚类算法的研究与实现[D];东北大学;2010年
中国重要报纸全文数据库 前10条
1 深圳特区报记者 谭大跃 实习生 李中迪 记录整理;大熊猫被选为测序对象[N];深圳特区报;2010年
2 记者 曹丽君;美研究人员发明基因组快速测序技术[N];光明日报;2005年
3 葛秋芳;美开发“快速”基因测序技术,省时又省钱[N];新华每日电讯;2008年
4 深圳特区报记者 谭大跃 通讯员 刘旭林 梁淡丽;华大基因年内登上“云”端[N];深圳特区报;2011年
5 记者 第五燕燕;400多位学者聚深话基因谈合作[N];深圳特区报;2009年
6 张思;基因研究,飞入寻常百姓家?[N];中国医药报;2008年
7 田池;研究远古生物启用新型基因测序器[N];大众科技报;2006年
8 葛秋芳;新技术测序个人基因组图谱公布[N];江苏科技报;2008年
9 记者 贾少强 通讯员 王静思;华大基因为200个丹麦人进行基因测序[N];深圳商报;2010年
10 记者 刘传书;我国基因测序技术设备实现“零”突破[N];科技日报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978