收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于MapReduce的DNA序列拼接算法研究

高进  
【摘要】:生物信息学是集生物、数学和计算机等领域的综合学科,主要研究内容是生物信息的处理。生物信息学通过研究生物数据中蕴藏的生物学意义来揭示其对生物体活动的影响。生物体基因组控制着生物体遗传、成长、衰老等生命过程,因此基因组测序是生物信息学中的重要课题之一。但是限于现有测序设备,大部分生物体的基因组无法直接测出,普遍使用的是鸟枪法测序。 鸟枪法测序中最重要的过程是序列拼接。目前,序列拼接算法主要分为基于Hamilton路径和基于欧拉(Euler)超路两种。基于Hamilton路径的算法利用的是"overlap-layout-consensus"方法,这种方法时间复杂度较高,且并没有很好克服重复序列的影响。基于欧拉超路的DNA序列拼接算法的提出,给出了DNA序列拼接的一种全新方法,克服了传统"overlap-layout-consensus"方法在拼接工作中的不足。但欧拉超路算法在拼接过程中需要生成de Bruijin图,对于序列较大的拼接工作,该图所维护的数据量十分庞大,这使存储和效率成为瓶颈问题。 目前已经有基于MapReduce的拼接算法提出,但是基于seed-and-extend技术,需要参照序列。2011年,也有了一些利用MapReduce解决de Bruijin图的探讨,但大都要进行图的划分,且这一思路也仅限探讨,没有任何软件的发布。 本文在研究欧拉超路算法的基础上,寻求一种基于MapReduce且避免图划分的并行策略,并在集群上进行实现。实验结果表明,使用并行策略,很好地克服了存储和效率的问题,同时在不对图进行划分的情况下,获得了更好的拼接结果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 周溜溜;业宁;徐昇;严敏利;;基于频繁子树挖掘的DNA重复序列识别方法[J];微电子学与计算机;2011年09期
2 郝燕玲;韩庆楠;徐聪;;伪灰度双模板匹配的多波束数据拼接算法[J];哈尔滨工程大学学报;2011年07期
3 储珺;聂春梅;王璐;张桂梅;;基于SIFT特征的多视点云数据配准和拼接算法[J];半导体光电;2011年03期
4 徐光著;朱冰莲;丰建军;;一种改进的动态场景拼接算法[J];电子科技;2011年07期
5 顾清华;郭进平;卢才武;;基于离散点的不规则巷道断面三维快速重构算法[J];金属矿山;2011年07期
6 吴蓉晖;吴岚;;IP追踪中的包标记算法[J];湖南大学学报(自然科学版);2011年06期
7 王玉亮;沈建新;廖文和;;基于SIFT特征的眼底图像自动拼接[J];中国图象图形学报;2011年04期
8 徐静;张仁斌;;视频拼接技术在可视化倒车雷达中的应用研究[J];电脑知识与技术;2011年19期
9 徐进;沈敏一;杨力;王炜强;刘济林;;基于双目光束法平差的机器人定位与地形拼接[J];浙江大学学报(工学版);2011年07期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 刘海英;陈刚;步宇翔;;碱基对的多铜修饰对DNA导电性的增强作用[A];中国化学会第28届学术年会第13分会场摘要集[C];2012年
2 赵宏远;李俊杰;桑润滋;;单细胞凝胶电泳技术检测不同处理山羊精子DNA损伤[A];中国畜牧兽医学会动物繁殖学分会第十五届学术研讨会论文集(下册)[C];2010年
3 刘玲;付强;朱化彬;彭秀丽;郝海生;杜卫华;赵学明;王栋;;牛毛囊基因组DNA制备方法的比较研究[A];中国畜牧兽医学会动物繁殖学分会第十五届学术研讨会论文集(上册)[C];2010年
4 梁春柳;;一个新的筛选化合物与DNA交互作用的简便方法[A];2010年全国药物毒理学学术会议论文集[C];2010年
5 张文众;李永宁;方瑾;梁春来;张倩男;;体外新评价方法——完整细胞核DNA检测板[A];全国生化/工业与卫生毒理学学术会议论文集[C];2010年
6 邹丹丹;汪海林;;基于DNA甲基化结合蛋白MBD的甲基化分析[A];中国化学会第28届学术年会第2分会场摘要集[C];2012年
7 张晔;杜智;杨斌;高英堂;;检测外周血中游离DNA的应用前景(综述)[A];天津市生物医学工程学会第29届学术年会暨首届生物医学工程前沿科学研讨会论文集[C];2009年
8 赵淑珍;刘光珍;;DNA免疫吸附治疗狼疮性肾炎的临床观察[A];第十一届全国中西医结合肾脏病学术会议论文汇编[C];2010年
9 陈士林;;中药DNA条形码鉴定体系[A];第十届全国药用植物及植物药学术研讨会论文摘要集[C];2011年
10 陆佳飞;周克隆;王缦;;磁珠法快速提取乙型肝炎病毒DNA的研究及其在诊断试剂中的应用[A];第五次全国免疫诊断暨疫苗学术研讨会论文汇编[C];2011年
中国博士学位论文全文数据库 前10条
1 郭晓兰;端粒功能异常诱导的DNA损伤反应及其在肿瘤发生中的作用与分子机制[D];重庆医科大学;2010年
2 陈志健;1.8 GHz微波对X射线和阿霉素致淋巴细胞DNA损伤修复及对蛋白表达的影响[D];浙江大学;2010年
3 朱慧芳;Y家族DNA聚合酶对化学致癌物MNNG应答的转录调控研究[D];浙江大学;2009年
4 万超;抗猪瘟嵌合DNA疫苗及TRIF的DNA疫苗佐剂效应研究[D];武汉大学;2009年
5 赵丽霞;克隆绵羊印记相关基因的DNA甲基化研究[D];内蒙古农业大学;2010年
6 沈美龙;基于DNA免疫的乙型肝炎病毒表面抗原大中小蛋白的免疫原性研究[D];南京医科大学;2010年
7 徐铁刚;细菌DNA磷硫酰化修饰与限制[D];上海交通大学;2008年
8 高鹏;特异性介导DNA转导的多结构域嵌合蛋白的构建、表达及鉴定[D];吉林大学;2011年
9 康大伟;DNA分子器件场效应理论研究[D];山东大学;2010年
10 高天;基于寡核苷酸芯片的地中海贫血特异性DNA甲基化的研究[D];第三军医大学;2009年
中国硕士学位论文全文数据库 前10条
1 李芳;基于磁性微粒的法医样本DNA纯化[D];西北大学;2011年
2 芦丽淦;柚皮素及聚乙二醇增强乙肝DNA疫苗免疫效果的研究[D];河南大学;2010年
3 杨锦艳;六种香豆素有效成分与DNA相互作用的研究[D];山西医科大学;2010年
4 林启凰;用于乳腺蛋白标志基因检测的DNA电化学生物传感器的研究[D];福建医科大学;2010年
5 于文静;亚麻韧皮部特异启动子克隆与26份种质DNA指纹图谱构建[D];中国农业科学院;2010年
6 Rebecca Simisola Agboola;硼(B)和氯化钠胁迫处理诱导高粱(Sorghum bicolor)自交系发生形态和DNA甲基化的变异[D];东北师范大学;2010年
7 石微;溴氰菊酯致大鼠DNA损伤及损伤后修复功能的影响[D];青岛大学;2010年
8 张诺;DNA-纳米羟基磷灰石修饰电极的制备及在生物分析中的应用[D];济南大学;2010年
9 郭珈辰;基于图形表示的DNA相似性分析及进化树构建算法研究[D];湖南大学;2010年
10 刘香港;基于功能材料的新型电化学DNA生物传感器的研制及应用研究[D];山东农业大学;2011年
中国重要报纸全文数据库 前10条
1 记者 李含;“DNA之父”詹姆斯·沃森做客清华论坛[N];新清华;2008年
2 ;英国:含冤入狱27年,DNA助他洗脱罪名[N];新华每日电讯;2009年
3 李志晖 秦亚洲 曹国厂;我国大规模利用DNA技术“打拐”[N];中国改革报;2009年
4 本报驻特拉维夫记者 陈克勤;DNA伪造带来的震动[N];光明日报;2009年
5 本报记者 张巍巍;DNA样本也能作假[N];科技日报;2009年
6 记者 郑晓春;可区分真伪DNA的检测技术问世[N];科技日报;2009年
7 沈建民;企业公民DNA从何而来[N];21世纪经济报道;2009年
8 记者 魏萍;做DNA鉴定不用去外地[N];宁夏日报;2010年
9 日报记者 曾繁华 闫友明 通讯员 刘晓颖;DNA:我的应用很广泛[N];柳州日报;2010年
10 韦崇结 刘晓颖;DNA,让作恶之徒现原形[N];广西政协报;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978