收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

RNA二级结构预测算法的研究

何静媛  
【摘要】: RNA(Ribonucleic Acid,RNA)分子在生物细胞中不仅充当着遗传信息的载体和传递工具,还具有催化RNA的剪接,加工和修饰RNA前体,调控基因表达和生物体的生长发育等一系列重要的功能,而功能与结构是密切相关的,因此对RNA分子结构的研究就成为分子生物学的一个重要领域。由于RNA分子具有降解速度快,难以结晶等特点,通过X射线晶体衍射和核磁共振等实验方法去测定RNA分子的立体结构花费的成本高、时间长,虽然测得的结果精确可靠,可是面对当前海量的生物序列,实验方法显然跟不上要求,因此RNA二级结构预测就成为研究RNA分子结构的主要手段。RNA二级结构预测是指借助于计算机手段和各种数学方法从理论上去预测RNA的空间结构,可为揭示RNA结构与功能的关系提供重要信息,大大提高认识RNA空间结构的效率。 论文对目前主流的RNA二级结构预测算法的理论和实现方法进行了细致的研究。通过对基于热力学的预测方法(包括Zuker的最小自由能算法、遗传模拟退火算法、Hopfield神经网络方法、免疫粒子群算法)和比较序列分析方法(协同变异预测模型、随机上下文无关语法预测)以及基于机器学习的分类预测方法的分析,对这些算法存在的优缺点进行了比较研究,总结出了RNA结构预测方法发展的趋势和要求,为本文的预测算法奠定了理论和实验基础。 首先论文分析了人工鱼群智能算法在优化问题中的优势和不足,并针对基本人工鱼群算法在解决离散问题的过程中存在的的缺陷进行了相应改进,首次将鱼群算法应用到RNA二级结构预测问题中,建立了一种基于人工鱼群算法的最小自由能算法模型。在对算法编码实现时,采用集合表示状态点,能有效地缩小搜索空间,有利于算法在较短时间内找到目标解。仿真实验与传统的基于最小自由能的相关算法进行了比较研究,结果表明,使用改进鱼群算法进行RNA序列的二级结构预测能获得较理想的预测效果,能有效减少计算量、节省计算时间,特别当待测序列长度大于500时,鱼群算法在收敛速度上有着较明显优势。 其次,研究了粒子群优化算法在组合优化问题中的应用背景,针对基本粒子群算法的早熟收敛,容易陷入局部最优且搜索精度不高等缺点,进行了相应的改进,提出了局部精英粒子群算法,在该算法中,通过改变粒子的邻居拓扑结构,使每个粒子拥有固定的局部邻居,每次迭代都会根据自身在邻居中的地位和状态以及历史最优值来调整下一步的状态。由于有效地保持粒子的多样性,使得算法有较好地跳出局部极值的特性。 本文根据局部精英粒子群算法的思想构建了一套基于最小自由能思想的RNA二级结构预测模型。在对算法进行编码时,使用集合来表示粒子的状态,巧妙地将粒子运动的速度和状态函数使用集合之间的运算来重载,避免了传统粒子群算法参数选择的烦恼。实验数据有力地支持了改进后的粒子群算法和新的粒子运动状态编码方式。 第三,通过扩展NSSEL(New Secondary Structure Element Labels,NSSEL)标签,创建了一套能够描述伪结结构信息的eNSSEL(extended NSSEL,eNSSEL)标签。一条RNA分子序列中的所有碱基都可以使用eNSSEL标签进行标记,从另一个角度来理解,即:任意一个碱基都可以被分类为某一个标签,因此,一条原始的RNA分子序列能与一条eNSSEL标签序列一一对应。由于eNSSEL标签携带了结构信息,因此,对于某一个RNA分子而言,只要得到其对应的标签序列,就可以知道其二级结构的组成。根据该思想,建立了基于SVMs(support vector machines,SVMs)的分类预测模型。该模型通过有效训练后,在可接受的预测精度范围里具有较低的计算复杂度,能有效地解决传统算法中存在的计算复杂性问题,为预测长链分子提供了一种全新的思路。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 唐四薪;刘艳波;尹军;;文法推断RNA二级结构的研究进展[J];生物信息学;2008年04期
2 梁成;骆嘉伟;李仁发;;一种新的RNA二级结构特征序列表示及相似性分析[J];计算机应用研究;2011年03期
3 胡桂武;彭宏;;利用混沌差分进化算法预测RNA二级结构[J];计算机科学;2007年09期
4 付微,黄竞伟,徐丽;RNA二级结构表示方法及其转换算法[J];计算机工程与应用;2004年14期
5 单夫一;骆嘉伟;;一种新的RNA二级结构的三维图形表示[J];武汉理工大学学报(信息与管理工程版);2007年05期
6 高世乐;丁克诠;;含假结RNA二级结构类的图语法[J];计算机工程与应用;2008年02期
7 夏培明;张岩;;基于茎区的自由能算法预测RNA二级结构[J];微计算机信息;2009年09期
8 唐四薪;周勇;邹赛;;基于词汇化随机文法模型的RNA二级结构预测[J];计算机工程与科学;2009年03期
9 何静媛;邹东升;何中市;;RNA二级结构预测的自适应鱼群算法模型[J];系统仿真学报;2010年06期
10 李恒武;朱大铭;纪秀花;;RNA二级结构预测算法的设计与实现[J];计算机工程与科学;2006年07期
11 胡桂武;彭宏;;基于免疫粒子群集成的RNA二级结构预测算法[J];计算机工程与应用;2007年03期
12 吕健雄;刘永帆;;计算机在流感病毒(Influenza RNA)结构分析领域的应用[J];中国新技术新产品;2009年24期
13 张洪礼;张娜;刘文远;王常武;;含伪结的RNA分子二级结构预测[J];计算机工程与应用;2011年08期
14 许丹;王爱荣;李金铭;;基于茎区的神经网络方法预测RNA二级结构[J];广西师范大学学报(自然科学版);2011年03期
15 何静媛;何中市;邹东升;;RNA二级结构预测的支持向量机模型研究[J];计算机科学;2008年04期
16 陈自郁;何中市;何静媛;;预测RNA二级结构离散粒子群优化算法[J];深圳大学学报(理工版);2009年03期
17 骆嘉伟;陈涛;;基于茎区组合的RNA二级结构预测算法[J];计算机应用;2010年06期
18 高世乐;丁克诠;;Rivas-Eddy RNA二级结构图书嵌入分类的实现方法[J];计算机工程与应用;2008年04期
19 刘振栋,李恒武,朱大铭;计算最大堆迭的RNA二级结构预测算法[J];南京大学学报(自然科学版);2005年05期
20 王攻本,屈婉玲,黄玉明,谢柏;面向生物遗传的计算机应用[J];计算机工程与应用;1986年08期
中国重要会议论文全文数据库 前2条
1 宋丹丹;邓志东;;基于模糊动态规划的RNA折叠算法的研究与实现[A];2005年中国智能自动化会议论文集[C];2005年
2 王见杨;黄可威;毛小红;陆长德;;九种家蚕病原性微孢子虫核糖体小亚单位RNA基因的克隆测序及亲缘关系分析[A];中国蚕学会养蚕与蚕生理病理学术讨论会论文汇编[C];2000年
中国博士学位论文全文数据库 前10条
1 廖波;计算分子生物学中若干问题研究[D];大连理工大学;2004年
2 高世乐;含假结RNA二级结构图的语法及拓扑分类[D];大连理工大学;2008年
3 刘忠钰;登革病毒C基因RNA二级结构及编码蛋白在病毒复制中的作用[D];中国人民解放军军事医学科学院;2009年
4 白凤兰;生物序列的图形表示及其应用[D];大连理工大学;2006年
5 刘立伟;蛋白质及RNA结构比较与进化分析[D];大连理工大学;2008年
6 郭颖;生物序列的几何刻画及应用[D];大连理工大学;2008年
7 方小永;基于比较序列分析的RNA二级结构预测与评估[D];国防科学技术大学;2007年
8 王文文;RNA二级结构的计数问题及其进化分析[D];大连理工大学;2009年
9 黄耀伟;传染性法氏囊病病毒全基因组克隆及反向遗传系统的建立[D];浙江大学;2002年
10 洪海燕;人干细胞因子在大肠杆菌中的高效表达及其在红系分化中功能的初步研究[D];第二军医大学;2002年
中国硕士学位论文全文数据库 前10条
1 胡名刚;基于真实结构特征的RNA二级结构预测方法研究[D];吉林大学;2014年
2 郭颖;RNA的二级结构[D];大连理工大学;2005年
3 杨红;RNA二级结构的计数[D];大连理工大学;2006年
4 李誌;基于马尔科夫链的RNA二级结构预测[D];吉林大学;2007年
5 刘振栋;预测RNA二级结构的快速计算方法的研究[D];山东大学;2005年
6 陆健;基于动态权重匹配的RNA二级结构预测算法[D];江苏大学;2007年
7 牟敬君;生物序列的图形表示及相似性分析[D];中国海洋大学;2008年
8 杨泽民;金藻类部分类群的分子系统学研究[D];暨南大学;2005年
9 彭政;带假结的RNA二级结构预测算法研究[D];湖南大学;2008年
10 杨中汉;高脂血症患者脂蛋白脂酶基因异常的初步研究[D];暨南大学;2001年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978