收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

蛋白质多序列比对算法及其评估算法的研究

巩志  
【摘要】:多序列比对是生物信息学中至关重要的一步。传统的序列比对的方法是NP难问题。目前的算法都是以牺牲某种程度的精度为代价,达到可实用的速度。由于现有的蛋白质多序列比对算法难以兼顾速度和精度,因而在基于氨基酸多序列比对算法的蛋白质进化演化研究中,也不可避免的存在着计算量大和难以保证准确性的缺点。另外,每一种多序列比对算法都有自己的优缺点。那么,只有了解了这些算法的优缺点,才能针对不同的数据选用不同的算法。这样,对于蛋白质多序列比对算法的性能评估就显得尤为重要。 对于蛋白质多序列比对算法优劣的评价方法,目前有很多种。但是,在蛋白质序列比对过程中会有噪声影响,还有人为因素的影响;由于这些原因,很难对每一个算法进行公正的评价。基于这个原因本文提出了置换距离的方法对蛋白质多序列比对算法进行评估,由于置换距离算法只关心蛋白质之间进化距离的相对次序而不考虑它们之间的细微差异,因此它能够克服噪声影响,具有更强的鲁棒性,从而对序列比对算法进行更加准确的评价。对于置换距离的度量本文用最长公共子序方法,它能够更快,更准确的反映出不同置换之间的差异性。 上面说到现有的蛋白质多序列比对算法计算速度慢,难以达到用户的需求,因此本文提出了基于相对熵的蛋白质多序列比对算法。一般的多序列比对算法运行速度都很慢,这是由于它们都必须进行漫长的氨基酸序列比对过程;而本文提出的相对熵算法却避免了这一过程,直接对蛋白质序列进行分析,这样就大大提高了计算的速度。另外,用相对熵算法得到的结果与其它多序列比对算法得到的结果大体一致。可见,相对熵多序列比对算法无论在计算速度还是在计算精度上都可以很好的满足人们的要求。 基于以上算法,本文首先用置换距离法对Dialign,Tcoffee,ClustalW等多序列比对算法进行评估,将评估结果与其它评估算法结果进行比较,以验证置换距离法的可行性。然后,用上面验证的置换距离法对本文提出的相对熵算法进行评价,从而证明了相对熵算法可行性及其在时间上的优势。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王涛,郁松年,颜鹤;一种优化的三序列比对算法及并行实现[J];计算机工程与应用;2005年11期
2 司徒浩臻;赵聚雪;许龙飞;;基于遗传算法的多序列比对算法研究[J];微计算机信息;2006年17期
3 彭东海;骆嘉伟;陈斐;;基于信息素智能更新的蚁群双序列比对算法[J];计算机工程与应用;2007年35期
4 周澄,郁松年;Smith-Waterman算法的若干优化及并行实现[J];计算机工程与应用;2003年23期
5 王占昌,张敏,迟忠先;一个新的多序列比对算法(英文)[J];生物数学学报;2005年03期
6 王彩芸;蔡乐才;;基于知识表达系统的序列比对研究[J];四川理工学院学报(自然科学版);2008年06期
7 李刚成;龙凯;;编码理论在双序列比对中的应用[J];科学技术与工程;2009年21期
8 赵刚;郭东伟;李丹;;基于序列比对的动态Web信息抽取算法[J];吉林大学学报(理学版);2010年03期
9 李大卫;;基于动态规划的序列比对的并行算法研究[J];井冈山大学学报(自然科学版);2011年03期
10 殷脂;殷卫红;;DNA序列数据分析技术综述[J];上海电力学院学报;2011年04期
11 杜娟;呼广跃;;数据压缩在序列比对中的应用[J];计算机工程与应用;2008年22期
12 钟佳;;校园网序列比对蜜罐系统设计与应用[J];山西师范大学学报(自然科学版);2011年02期
13 张福祥;;序列比对算法CLUSTAL W并行化的探索与研究[J];潍坊学院学报;2007年04期
14 郭俊恩;王士同;徐红林;;基于蚁群遗传算法的DNA序列比对方法[J];生物信息学;2007年04期
15 张永;王瑞;;生物信息学中的序列比对算法[J];电脑知识与技术;2008年01期
16 郭俊恩;王士同;徐红林;;基于蚁群遗传算法的氨基酸序列比对方法[J];计算机应用;2007年06期
17 秦拯;尹毅;陈飞杨;陈薇娜;董锐;王泽平;;基于序列比对的攻击特征自动提取方法[J];湖南大学学报(自然科学版);2008年06期
18 徐硕;朱礼军;乔晓东;薛春香;;基于双序列比对的中文术语语义相似度计算的新方法[J];情报学报;2010年04期
19 叶笑春;林伟;范东睿;张浩;;蛋白质序列比对算法在众核结构上的并行优化[J];软件学报;2010年12期
20 孙义;胡雨霁;黄皓;;基于序列比对的SQL注入攻击检测方法[J];计算机应用研究;2010年09期
中国重要会议论文全文数据库 前10条
1 许龙飞;段敏;陈孝卫;冉丽;朱婵;;生物DNA序列比对算法研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 王盛;吴长刚;孙慰迟;;带约束星形序列比对复杂性的研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
3 陈宁涛;王能超;施保昌;;生物多序列比对的并行算法[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
4 冯文龙;赵清杰;;基于遗传算法的DNA多序列比对问题[A];2007年中国智能自动化会议论文集[C];2007年
5 张朝政;于涟;;2型猪圆环病毒浙江分离株的遗传与进化分析[A];浙江省免疫学会第五次学术研讨会论文汇编[C];2004年
6 刘晓辉;李晓琴;任文科;徐海松;;α类蛋白折叠类型的氨基酸取代矩阵研究[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
7 陆斌;骆志刚;苏光龙;丁凡;;RNA序列结构比对算法综述[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
8 宋丹丹;邓志东;;一种基于模糊神经网络的ncRNA基因预测方法[A];2009年中国智能自动化会议论文集(第五分册)[东南大学学报(增刊)][C];2009年
9 刘志华;董晨;孙啸;孟继鸿;;基于序列特征的戊肝病毒基因分型方法[A];第十次中国生物物理学术大会论文摘要集[C];2006年
10 宋长年;章镇;胡钟东;渠慎春;熊爱生;姚泉洪;乔玉山;;砂梨扩展蛋白基因cDNA克隆及全序列分析[A];中国园艺学会十届二次理事会暨学术研讨会论文摘要集[C];2007年
中国博士学位论文全文数据库 前10条
1 康晓军;基因序列比对算法在SNP中的研究及应用[D];华中农业大学;2011年
2 唐玉荣;生物信息学中的序列比对算法研究[D];中国农业大学;2004年
3 王栋;蛋白质序列的并行分类方法研究[D];天津大学;2010年
4 周红;基于de Bruijin图的DNA多序列比对并行算法研究[D];天津大学;2010年
5 张敏;生物信息学中多序列比对等算法的研究[D];大连理工大学;2005年
6 葛宏伟;基于计算智能的若干优化问题研究[D];吉林大学;2006年
7 刘立芳;生物信息学中的多序列比对与模体识别问题研究[D];西安电子科技大学;2006年
8 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
9 谷俊峰;蛋白质结构预测中几个关键问题的研究[D];大连理工大学;2009年
10 龙海侠;进化算法及其在生物信息中的应用[D];江南大学;2010年
中国硕士学位论文全文数据库 前10条
1 巩志;蛋白质多序列比对算法及其评估算法的研究[D];山东经济学院;2011年
2 苗素超;基于锚点的多基因组序列比对算法[D];西安电子科技大学;2010年
3 周健;水稻MiRNA关键区域序列比对算法研究[D];大连海事大学;2010年
4 司徒浩臻;基于遗传算法的多序列比对算法研究[D];暨南大学;2006年
5 朱贤芳;生物序列的比对算法比较研究[D];南京理工大学;2005年
6 段敏;生物DNA序列比对算法研究[D];暨南大学;2005年
7 邢云冬;木马网络通信特征提取技术研究[D];解放军信息工程大学;2010年
8 李重阳;多普勒气象雷达图像逆风区的检测与识别[D];西安电子科技大学;2009年
9 徐小俊;群智能优化算法在多序列比对中的应用[D];陕西师范大学;2011年
10 刘嘉怡;生物多序列比对研究算法[D];电子科技大学;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978