收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

生物信息学中序列拼接程序的并行化研究

杨琪  
【摘要】: 当前随着生物领域测序等技术的飞速发展,人类越来越多的获得了关于动植物生命的信息,诸如其DNA和蛋白质组成等等。在日益累计的数据面前,以往所用的近乎手工操作的处理分析方法显然大大的落后于研究的要求。于是借助于计算技术来加快处理速度,加大处理规模成为一个新兴的研究领域,引起了全世界生物学家和计算技术研究人员的广泛关注。将生物体上的生命信息转化为计算机所能理解的形式(例如字符串),测序是关键的一步。由于测序精确度的限制,目前只能保证一定长度范围内的序列是准确可信的,于是就需要将众多的序列拼接组合以恢复原来长序列的面貌。 当前测序技术的发展使得每次拼接任务所面对的数据量越来越大,而且我们需要同时进行越来越多的任务。本文主要就是针对当前应用最为广泛的一个拼接程序phrap来作出分析,加以并行化改造以期在存储和时间上有所优化,扩展其处理能力并使得现有的计算资源能容纳更多的拼接任务。文章首先介绍了序列拼接所依赖的理论基础,然后着重分析了程序的数据结构,流程和主要函数,为并行化作好准备并提供方向。在第三和第四章分别针对phrap占用内存量大和运行时间的问题作出了并行化的改造。第五章就今后的工作的方向重点阐述了个人观点。本文主要贡献如下: 1.针对目前还没有解决方案的phrap大量消耗存储问题,在集群上用共享存储的方式进行了改造,使得起码一半的内存消耗可以在集群各节点上基本均匀的分布,突破了phrap对单节点可用资源的依赖。对于一定的计算资源,从整体上扩充了其处理数据的能力,从而一定程度内缓解了当前数据产生速度和处理速度之间的矛盾。而且其中对内存分布的分析信息对以后同类工作提供了极大的便利。 2.分析phrap中一个主要的耗时部分:序列拼接过程。对原来只能串行执行的过程挖掘出了其隐藏的并行性,实现并进行了测试。就本人所知,当前对phrap的时间优化主要是从程序的序列比对部分入手,针对拼接部分的算法优化是没有先例的,这部分的工作对phrap的优化在理论上是一个切实的推进,目前phrap中的主要部分都已经没有了结构上的串行性,对于以后的工作带来很大的便利。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨迎春;;液晶显示器应开拓大尺寸市场[J];现代显示;2011年07期
2 梁剑江;;浅谈DLP投影拼接显示系统的建设[J];华章;2011年14期
3 ;中达电通推出弧形LED拼接显示系统[J];电源技术应用;2010年01期
4 鲁骏;宋俊辉;;基于时序模型的农产品价格数据挖掘研究[J];信息系统工程;2011年08期
5 宋丽平;;C-B样条曲线的分割和拼接[J];计算机技术与发展;2011年09期
6 李仰志;程剑;吕晶;李广侠;李志强;;基于Walsh变换的GPS C/A码快速捕获算法[J];电子学报;2011年06期
7 ;三菱电机LCD窄边拼接显示墙加速布局中国市场[J];微电脑世界;2011年08期
8 ;三菱电机LCD窄边拼接显示墙加速布局中国市场[J];通讯世界;2011年08期
9 辛伟;普杰信;;点到邻域重心距离特征的点云拼接[J];中国图象图形学报;2011年05期
10 ;三星商用大屏UD55A推动能源行业向信息化发展[J];电子制作;2011年07期
11 陈思;张卫杰;杨健;宋小全;;基于克隆选择的雷达抗同型干扰工作序列设计[J];电波科学学报;2011年03期
12 ;工程数学[J];中国无线电电子学文摘;2011年03期
13 刀刀棋;;爱上手机摄影 打造炫酷围脖照片[J];移动信息;2011年06期
14 ;三星商用大屏显示器[J];办公自动化;2011年13期
15 孔祥珍;刘同飞;;VATION拼接处理系统在高炉自动化监控系统中设计与应用[J];硅谷;2011年16期
16 柳晓华;万幼川;黄解军;;一种基于XML数据模型的时空查询代数探讨[J];地理空间信息;2011年03期
17 ;6月优异版面[J];青年记者;2011年19期
18 ;三星商用大屏UD55A继续推动能源行业信息化发展[J];现代显示;2011年07期
19 郭建伟;;我的超级密码本[J];电脑迷;2011年12期
20 大江东去;;赤手空拳批量发表图片[J];电脑迷;2011年14期
中国重要会议论文全文数据库 前10条
1 杨峰;雷连成;;胸膜肺炎放线杆菌血清3型与5型菌株基因组特征序列筛选与分析[A];中国畜牧兽医学会生物制品学分会中国微生物学会兽医微生物学专业委员会2010年学术年会(第三届中国兽药大会学术论坛)论文集[C];2010年
2 刘学智;;浅谈利用AML程序进行基础地理数据线状要素的拼接[A];吉林省测绘学会2008年学术年会论文集(下)[C];2008年
3 李羽;韩勇;赵刚;青玲;杨水英;孙现超;;温州蜜柑萎缩病毒编码大外壳蛋白基因克隆分析[A];粮食安全与植保科技创新[C];2009年
4 姚燕来;闵航;;CODEHOP PCR扩增Rhodococcus sp.YYL中四氢呋喃单加氧酶基因部分同源序列[A];第十次全国环境微生物学术研讨会论文摘要集[C];2007年
5 范留彬;张利英;王艳丽;李连杰;刘国栋;;以化学键为加和单元研究三元共聚物的玻璃化温度[A];2009年全国高分子学术论文报告会论文摘要集(上册)[C];2009年
6 周学广;;两类混沌函数周期的证明[A];2000中国控制与决策学术年会论文集[C];2000年
7 党耀国;刘思峰;翟振杰;;区间数关联度的研究[A];管理科学与系统科学研究新进展——第8届全国青年管理科学与系统科学学术会议论文集[C];2005年
8 吴志明;闫若潜;刘光辉;盛敏;方先诊;张志凌;;猪附红细胞体PCR诊断方法的建立及应用[A];中国畜牧兽医学会2006学术年会论文集(下册)[C];2006年
9 李树甫;钱昌松;韩庆生;;基于模极大值和分层搜索策略的无人机序列图像拼接[A];国家安全地球物理丛书(三)——地球物理探测与应用[C];2007年
10 恽长安;;中钢大桥钢管拱肋加工控制、拼接、吊装优化工艺[A];全国城市公路学会第十八届学术年会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 聂维琳;变点靠近序列端点的检测问题[D];武汉大学;2010年
2 兰欢;新基因PRR11在细胞增殖和细胞周期中功能的研究[D];重庆医科大学;2011年
3 郭晓贤;跨膜区突变对ABC转运蛋白Pdr5p功能的影响及其机制研究[D];浙江大学;2012年
4 张英英;中国新疆和重庆地区多物种博尔纳病病毒的检测及种系发生分析[D];重庆医科大学;2010年
5 柳广东;三种经济绒螯蟹的遗传学和形态学研究[D];中国海洋大学;2005年
6 刘勇;河豚鱼多药耐药基因组全长序列和邻座基因的分析[D];中国协和医科大学;1998年
7 童英;翻译调控序列的退化性突变及其对重复拷贝亚功能化的影响[D];浙江大学;2010年
8 尹春煜;中国HIV-1主要结构基因的序列变异性以及耐药相关性突变分析[D];复旦大学;2005年
9 展群岭;博尔纳病病毒分子流行病学研究[D];重庆医科大学;2010年
10 张小燕;胶原蛋白肽生物功能材料的研究与开发[D];西北工业大学;2006年
中国硕士学位论文全文数据库 前10条
1 侯晓慧;牛Meg8基因的克隆、组织表达及印记状态分析[D];河北农业大学;2011年
2 陈志华;茅盾小说的叙事结构分析[D];山东师范大学;2007年
3 欧阳景根;政治发展理论的序列观评析[D];中国人民大学;1999年
4 曹如姬;山西五台山寺庙建筑布局及空间组织[D];太原理工大学;2005年
5 吴海强;体育教育专业本科学生实践能力培养的路径研究[D];河南大学;2008年
6 杨春龙;连续映射的几种熵的研究[D];广西大学;2012年
7 宋灿磊;江门某医院儿童急性腹泻患者诺如病毒的检测与毒株型别分析[D];南方医科大学;2010年
8 Jyotsna Shakya;与HERV-K相关的一种未知功能的mRNA在头颈部肿瘤组织中表达增加[D];吉林大学;2012年
9 裴志花;牛O型口蹄疫病毒内蒙古疫苗株p1基因的克隆与序列分析[D];内蒙古农业大学;2005年
10 朱涛;嗜铁钩端螺旋菌Leptospirillum ferriphilum UBK03抗镍操纵子表达调控机理研究[D];中国农业科学院;2011年
中国重要报纸全文数据库 前10条
1 张益博;如何确定打死的就是拉登[N];国防时报;2011年
2 曹琰;机构编制和职级序列规范工作启动[N];华中电力报;2009年
3 记者 郭春雨 王 钰;吉林全面实行书记员单独序列[N];人民法院报;2002年
4 赵卫忠;首批苏-30多功能歼击机加入印度作战序列[N];中国航空报;2002年
5 记者 王海亮 通讯员 郭玉鑫;塘沽实现书记员单独序列管理[N];人民法院报;2002年
6 王风竹 余西云;建构三峡古文化序列的力作[N];中国文物报;2002年
7 黄燕平;产储出序列 气储创新高[N];中国石化报;2001年
8 袁群宝;从序列中挖掘战斗力[N];解放军报;2009年
9 本报记者 蒋晓波;浙江:市场考验非公务员序列[N];中国财经报;2002年
10 记者 赵家新 通讯员 梁建斌 杨秀英;压力层级传递 荣誉待遇相连[N];人民公安报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978