收藏本站
《山东大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

有向基因组复合操作重组排序算法研究

郝凡昌  
【摘要】:比较基因组学是生物信息学的一个重要研究分支,计算两个基因组的量化距离是比较基因组学的基本问题,应用于构建进化树、探索基因功能、分析疾病致病原理等实践中。基因组是一个染色体集合,染色体为一个基因序列,每个基因表示为一个整数。基因组分有向和无向两种数据形式,每个基因相对所在染色体中的相邻基因,均有两个方向,在有向基因组中,采用“+”和“-”分别表示-个基因的两个方向。 基因组的重组揭示了基因组改变基因排列次序的行为,在基因组重组排序问题中表述为改变基因排列次序的操作,有翻转(Reversal)、移位(Translocation)、转位(Transposition)等基本形式。 给定两个基因组A、B,基因组重组排序要求寻找将A转化为B的一组有序操作,最小化操作次数,将A转化为B的最小重组次数即为A与B的重组距离。沿着由简而繁的路线,人们讨论了多种形式的基因组重组排序问题,和它们的算法与复杂性。 Bafna和Pevzner首先给出有向基因组翻转排序近似度为1.5的多项式算法,Hannenhalli和Pevzner设计出O(n5)时间精确算法,Kaplan、Shamir和Tarjan将算法时间复杂度改进为O(n2)。对于基因组的移位排序问题,Hannenhalli首次设计出O(n3)时间精确算法,朱大铭和马绍汉将该算法的时间复杂度改进为O(n2logn),王鲁生、朱大铭、刘晓文和马绍汉进一步将算法的时间复杂度改进为O(n2),李国君、亓兴勤、王骁力和朱滨海给出了计算移位距离的O(n)时间算法。对于基因组转位排序问题,Bafana与Pevzner最早给出近似度为1.5的O(n2)时间算法。Hartman和Shamir又给出近似度为1.5的更为简洁的近似算法。Elias和Hartman将近似度改进为1.375。最近Bulteau、Fertin和Rusu证明该问题是NP-hard问题。 我们将包含多种操作形式的基因组重组排序称为基因组的复合重组排序问题。因复合重组排序更具一般性,所以显得更有应用价值。Walter、Dias和Meidanis给出基因组的翻转和转位排序近似度为2的近似算法。Gu、Peng和Sudborough给出了基因组的翻转、转位和反转位排序问题近似度为2的近似算法。Hartman和Sharan给出基因组的翻转和反转位排序问题近似度为1.5的近似算法。Hannenhalli和Pevzner设计出基因组的翻转和移位排序问题的多项式时间精确算法。尹晓和朱大铭给出这一问题的一个新多项式算法。尹晓和朱大铭于2010年设计出基因组的移位、分断和连接排序的精确算法,时间复杂性为O(n(?))。 人们还发现在基因组的重组演化中,伴有插入与删除基因片段的动作,许多分子生物学实践需要人们在基因组中实施插入与删除基因片段的操作。亓兴勤、李国君、李曙光等首次讨论了有向基因组的移位和删除排序问题,他们给出了有向基因组移位和删除排序的多项式算法,近似度达到OPT+2, OPT为两个基因组的移位删除距离。另外,亓兴勤、李国君、李曙光等描述了基因组的移位、插入和删除排序问题,并给出了解决该问题的一个启发式算法。 我们仍然讨论有向基因组的移位、插入与删除排序算法。问题的输入数据为两个有向基因组A和B,移位删除排序要求寻找将A转化为B的移位、删除操作序列,使移位、删除次数最小化;移位插入删除排序问题要求寻找将A转化为B的移位、插入、删除操作序列,使移位、插入、删除次数最小化。 首先讨论有向基因组移位和删除排序问题的求解算法。仍然利用圈图表达两个基因组的基因排列次序差异。圈图中含有一种被称为极小子排列的特殊结构子图,其数目和相对位置是影响有向基因组移位删除距离的关键因素。可将圈图中的极小子排列和它们相邻关系表示为一个森林。我们进一步根据圈图中描述极小子排列的森林的不同结构特征,分34种情况分别给出了有向基因组移位删除距离的精确数值。亓兴勤等给出的移位删除距离含有基因数目、染色体条数、圈的数目、偶隔离带存在性和极小子排列奇偶性辅助参数、间接圈数目、间接极小子排列数目,共6个参数。我们重新观察了圈图结构性质,引入两个新的特征参数:不可消除间接极小子排列数和打破间接极小子排列的间接普通圈数后,把所有情况下最小的移位删除次数统一为移位删除距离计算公式。推导移位删除距离公式的过程,自然地给出基因组的移位删除精确算法。(第3章) 有向基因组移位插入删除排序求解,可先利用移位删除算法构造一个中间基因组,然后将源基因组由插入操作得到中间基因组,再调用移位删除算法将中间基因组变换为目标基因组而完成。由有向基因组的移位删除距离公式,我们给出了有向基因组移位插入删除距离的计算公式。(第4章) 继续讨论了包含副本染色体和副本基因的有向基因组翻转,移位,转位,块交换,分断,连接排序的求解方法。划分为删除副本、同尾化基因组、规范化基因组重组排序三个功能模块,得到基因组复合重组排序的一个实用计算软件。最后给出初步的实验结果。(第5章) 本文创新点可以归纳如下: 1).首次给出了基因组的移位和删除距离公式,并给出求解该距离值及对应重组序列的一个多项式时间精确算法。 2).将有向基因组移位和删除排序的时间复杂度由O(n3)时间改进到O(n2)时间。 3).首次给出了基因组的移位、插入和删除距离公式,同时给出有向基因组移位插入删除排序的一个新多项式时间精确算法。
【学位授予单位】:山东大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP301.6

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 栾峻峰,朱大铭,马绍汉;实例序列条数为常数9的翻转距离星树问题[J];计算机研究与发展;2003年08期
2 郝凡昌;栾峻峰;朱大铭;张鹏;李明;;通过交互式移位-插入-删除进行基因组排序的较快算法[J];计算机研究与发展;2010年11期
3 栾峻峰;朱大铭;马绍汉;;计算生物学中有关基因组翻转距离的NPC问题[J];计算机科学;2002年11期
4 崔筠;朱大铭;马绍汉;;基因组重组排序算法综述[J];计算机科学;2006年12期
5 朱大铭,马绍汉;基因组Translocation排序问题的改进多项式算法[J];计算机学报;2002年02期
6 刘晓,朱大铭,马绍汉,李子茂,王鲁生;有向基因组移位排序问题的O(n~2)快速算法[J];计算机学报;2004年10期
7 尹晓;朱大铭;;基因组一般移位排序问题的多项式时间算法[J];计算机学报;2010年05期
8 朱大铭,栾峻峰,马绍汉;Hardness and Methods to Solve CLIQUE[J];Journal of Computer Science and Technology;2001年04期
9 娄晓文;朱大铭;;Sorting Unsigned Permutations by Weighted Reversals,Transpositions,and Transreversals[J];Journal of Computer Science & Technology;2010年04期
10 尹晓;朱大铭;;有向基因组移位排序算法的比较与评测[J];计算机与数字工程;2008年10期
中国博士学位论文全文数据库 前3条
1 亓兴勤;计算生物学中基因组重组排序问题的算法研究[D];山东大学;2006年
2 崔筠;无向基因组的移位排序算法[D];山东大学;2006年
3 尹晓;基因组重组排序问题的算法研究[D];山东大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 陶玉敏,曾涛,莫舒园,石艳霞;用模拟退火算法求解无向排列的反转排序问题[J];鞍山科技大学学报;2004年03期
2 陶玉敏;;无向反转排序问题的遗传模拟退火求解[J];辽宁科技大学学报;2009年04期
3 Thach Cam Nguyen;Hieu Trung Ngo;Nguyen Bao Nguyen;;Sorting by Restricted-Length-Weighted Reversals[J];Genomics Proteomics & Bioinformatics;2005年02期
4 谢芳;海荣;俞东征;;鼠疫耶尔森菌基因组重排研究进展[J];疾病监测;2010年05期
5 ;A 14/11-approximation algorithm for sorting by short block-moves[J];Science China(Information Sciences);2011年02期
6 栾峻峰,朱大铭,马绍汉;实例序列条数为常数9的翻转距离星树问题[J];计算机研究与发展;2003年08期
7 郝凡昌;栾峻峰;朱大铭;张鹏;李明;;通过交互式移位-插入-删除进行基因组排序的较快算法[J];计算机研究与发展;2010年11期
8 王映龙;杨炳儒;宋泽锋;陈卓;唐建军;;基因序列相似程度的LCS算法研究[J];计算机工程与应用;2007年31期
9 栾峻峰;朱大铭;马绍汉;;计算生物学中有关基因组翻转距离的NPC问题[J];计算机科学;2002年11期
10 陈超;栾峻峰;;枚举有符号基因组的可行交互移位算法[J];计算机工程与科学;2010年09期
中国重要会议论文全文数据库 前1条
1 谢青松;刘培强;朱大铭;;短块移动排序研究进展[A];2006年全国理论计算机科学学术年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 陈宏宇;关于部分排序的基因组重组问题的研究[D];山东大学;2011年
2 陈健美;甘蓝型油菜2个细胞质雄性不育系的线粒体基因组研究[D];南京农业大学;2011年
3 栗茂腾;甘蓝型油菜新类型的创建和油菜亚基因组间杂种优势研究[D];华中农业大学;2003年
4 王玲平;十字花科植物CYP86MF同源基因的结构、功能及进化关系的研究[D];浙江大学;2004年
5 毛新国;小麦族A、S、D二倍体种全长cDNA文库构建及序列初步分析[D];中国农业科学院;2004年
6 罗建勋;云杉天然群体遗传多样性研究[D];中国林业科学研究院;2004年
7 沈一飞;生物序列数据比较与模体发现算法研究[D];中国科学技术大学;2006年
8 卢孟柱;[D];Swedish University of Agricultural Sciences;1997年
9 陈汀;计算生物学中若干组合优化问题的研究[D];浙江大学;2006年
10 田相军;水稻线粒体基因组[D];浙江大学;2006年
中国硕士学位论文全文数据库 前10条
1 李特灵;恋岩花属和喜花草属的分类研究[D];中南林业科技大学;2007年
2 郝勇;计算生物学中有关基因组移位—删除排序问题的研究[D];山东大学;2011年
3 陈超;交互移位中位点问题的算法研究[D];山东大学;2011年
4 杜同庆;一个芥菜型油菜品种资源的线粒体基因组序列分析[D];南京农业大学;2011年
5 郑秀;甘蓝型油菜线粒体DNA提取及基因表达分析研究[D];南京农业大学;2010年
6 张锡芝;黑龙江省农田防护林树种选育及营造技术研究[D];黑龙江大学;2010年
7 谢豪;近似字符串匹配研究及其在URL检测中的应用[D];华南理工大学;2011年
8 赵杨;红麻细胞质雄性不育相关基因nad的克隆与再生体系初探[D];广西大学;2011年
9 贺晶;山茶属红山茶组植物RAPD分类研究[D];中南林学院;2001年
10 薛喜枚;粗枝云杉(Picea asperata Mast.)遗传多样性的RAPD及AFLP分析[D];中国科学院研究生院(成都生物研究所);2005年
【二级参考文献】
中国期刊全文数据库 前4条
1 朱大铭,马绍汉;基因组Translocation排序问题的改进多项式算法[J];计算机学报;2002年02期
2 刘晓,朱大铭,马绍汉,李子茂,王鲁生;有向基因组移位排序问题的O(n~2)快速算法[J];计算机学报;2004年10期
3 姜涛;;Some Algorithmic Challenges in Genome-Wide Ortholog Assignment[J];Journal of Computer Science & Technology;2010年01期
4 朱大铭,马绍汉,雷鹏;翻转距离星树问题的计算复杂度和近似算法[J];软件学报;2002年06期
【相似文献】
中国期刊全文数据库 前10条
1 赵殿满;排序算法的优化[J];计算机应用与软件;1987年02期
2 杨宪泽;长记录位置不变的排序算法[J];软件学报;1993年02期
3 黄干平;并行“冒泡”排序算法的改进[J];武汉大学学报(自然科学版);1994年01期
4 黄橡丽,王兵;2-路插入排序的一种新算法[J];天津纺织工学院学报;1996年01期
5 刘文浩 ,张威;多线程技术实现排序算法[J];电脑编程技巧与维护;2005年08期
6 李强,李会容,张雪峰;关于冒泡排序的改进算法的分析与比较[J];攀枝花学院学报;2005年04期
7 徐金雷;杨晓江;;专业搜索引擎的排序算法研究[J];现代图书情报技术;2006年07期
8 陈先红;;基于VB的排序算法比较[J];科技信息;2009年35期
9 王永刚;;排序算法综述[J];电脑知识与技术(学术交流);2006年29期
10 徐金雷;杨晓江;;基础教育资源搜索引擎的排序算法研究[J];电化教育研究;2007年02期
中国重要会议论文全文数据库 前10条
1 周晓方;金志权;;寻找最佳分布式排序算法[A];第九届全国数据库学术会议论文集(上)[C];1990年
2 张志强;梁婷婷;谢晓芹;;一种基于用户标记的搜索结果排序算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 刘春阳;叶君峰;母海龙;陆秋霞;陈沧;高莺;;一种商品标题主题词的重要性排序算法[A];第五届全国信息检索学术会议论文集[C];2009年
4 刘凯鹏;方滨兴;;一种基于社会性标注的网页排序算法[A];第五届全国信息检索学术会议论文集[C];2009年
5 张健沛;李连江;杨静;;个性化搜索引擎排序算法的研究与改进[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 黄毅;李剑;祁金才;张锦雄;;线性阵列上的奇偶归拆排序并行算法的MPI实现[A];广西计算机学会2004年学术年会论文集[C];2004年
7 吴志彬;陈义华;;ANP中超矩阵排序算法研究[A];2006中国控制与决策学术年会论文集[C];2006年
8 陈丛丛;石冰;陈健;;面向主题的查询相关网页排序算法[A];第三届中国智能计算大会论文集[C];2009年
9 王少帅;汤庆新;姚路;;并行独立集排序算法的改进与实现[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
10 史亚维;张茹;杨义先;钮心忻;;一种改进的用于GIF图像的脆弱水印算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
中国重要报纸全文数据库 前10条
1 广东 黄陀;基本算法简介(三)[N];电脑报;2001年
2 郑依华;搜索引擎也开源[N];计算机世界;2006年
3 胥小红;Autonomy:挑战知识管理的极限[N];大众科技报;2007年
4 PALADIN;对算法进行分析(2)[N];电脑报;2003年
5 王立群;搜索新生代[N];中国计算机报;2005年
6 ;Peribit将推出数据中心用网络平台[N];计算机世界;2004年
7 百度公司CEO 李彦宏;为搜索引擎写答卷[N];中国计算机报;2000年
8 吴怀宇;搜索引擎进入细分时代[N];中国经营报;2007年
9 中国虫;算法演义[N];电脑报;2003年
10 PALADIN;算法演义[N];电脑报;2003年
中国博士学位论文全文数据库 前10条
1 郝凡昌;有向基因组复合操作重组排序算法研究[D];山东大学;2011年
2 农庆琴;在线排序与路由安排[D];郑州大学;2006年
3 尹晓;基因组重组排序问题的算法研究[D];山东大学;2010年
4 王灿;基于半监督流形学习的Web信息检索技术研究[D];浙江大学;2009年
5 程凡;基于排序学习的信息检索模型研究[D];中国科学技术大学;2012年
6 刘旭;基于图剖分和图排序的负载平衡算法研究[D];中国工程物理研究院;2008年
7 张金松;基于引文上下文分析的文献检索技术研究[D];大连海事大学;2013年
8 陈红涛;基于搜索日志的用户行为研究及应用[D];北京邮电大学;2008年
9 杨远;MIMO系统中的检测算法研究[D];西安电子科技大学;2009年
10 王世良;MIMO通信系统中接收端检测技术的研究[D];北京邮电大学;2013年
中国硕士学位论文全文数据库 前10条
1 王靖;数据库管理系统中高能效排序算法[D];浙江工业大学;2012年
2 申大明;带到达时间的单位工件在线排序[D];浙江大学;2007年
3 彭聪;一种在移动网络环境下的网页排序算法的研究[D];湖南大学;2010年
4 徐金雷;专业搜索引擎的排序算法研究[D];南京师范大学;2007年
5 田志章;流水型CONWIP生产控制系统研究[D];武汉理工大学;2007年
6 程建;一种网页搜索引擎原型系统的设计与实现[D];北京邮电大学;2009年
7 李连江;个性化搜索引擎模型的研究与改进[D];哈尔滨工程大学;2008年
8 杨斯崑;基于主题相关性的社交问答系统个性化专家排序算法的研究[D];北京交通大学;2014年
9 侯红梅;图像搜索重排序算法研究[D];山东大学;2014年
10 陈辉;金融领域的博客信息采集与排序算法研究[D];哈尔滨工业大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026