收藏本站
《重庆大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

RNA二级结构预测算法的研究

何静媛  
【摘要】: RNA(Ribonucleic Acid,RNA)分子在生物细胞中不仅充当着遗传信息的载体和传递工具,还具有催化RNA的剪接,加工和修饰RNA前体,调控基因表达和生物体的生长发育等一系列重要的功能,而功能与结构是密切相关的,因此对RNA分子结构的研究就成为分子生物学的一个重要领域。由于RNA分子具有降解速度快,难以结晶等特点,通过X射线晶体衍射和核磁共振等实验方法去测定RNA分子的立体结构花费的成本高、时间长,虽然测得的结果精确可靠,可是面对当前海量的生物序列,实验方法显然跟不上要求,因此RNA二级结构预测就成为研究RNA分子结构的主要手段。RNA二级结构预测是指借助于计算机手段和各种数学方法从理论上去预测RNA的空间结构,可为揭示RNA结构与功能的关系提供重要信息,大大提高认识RNA空间结构的效率。 论文对目前主流的RNA二级结构预测算法的理论和实现方法进行了细致的研究。通过对基于热力学的预测方法(包括Zuker的最小自由能算法、遗传模拟退火算法、Hopfield神经网络方法、免疫粒子群算法)和比较序列分析方法(协同变异预测模型、随机上下文无关语法预测)以及基于机器学习的分类预测方法的分析,对这些算法存在的优缺点进行了比较研究,总结出了RNA结构预测方法发展的趋势和要求,为本文的预测算法奠定了理论和实验基础。 首先论文分析了人工鱼群智能算法在优化问题中的优势和不足,并针对基本人工鱼群算法在解决离散问题的过程中存在的的缺陷进行了相应改进,首次将鱼群算法应用到RNA二级结构预测问题中,建立了一种基于人工鱼群算法的最小自由能算法模型。在对算法编码实现时,采用集合表示状态点,能有效地缩小搜索空间,有利于算法在较短时间内找到目标解。仿真实验与传统的基于最小自由能的相关算法进行了比较研究,结果表明,使用改进鱼群算法进行RNA序列的二级结构预测能获得较理想的预测效果,能有效减少计算量、节省计算时间,特别当待测序列长度大于500时,鱼群算法在收敛速度上有着较明显优势。 其次,研究了粒子群优化算法在组合优化问题中的应用背景,针对基本粒子群算法的早熟收敛,容易陷入局部最优且搜索精度不高等缺点,进行了相应的改进,提出了局部精英粒子群算法,在该算法中,通过改变粒子的邻居拓扑结构,使每个粒子拥有固定的局部邻居,每次迭代都会根据自身在邻居中的地位和状态以及历史最优值来调整下一步的状态。由于有效地保持粒子的多样性,使得算法有较好地跳出局部极值的特性。 本文根据局部精英粒子群算法的思想构建了一套基于最小自由能思想的RNA二级结构预测模型。在对算法进行编码时,使用集合来表示粒子的状态,巧妙地将粒子运动的速度和状态函数使用集合之间的运算来重载,避免了传统粒子群算法参数选择的烦恼。实验数据有力地支持了改进后的粒子群算法和新的粒子运动状态编码方式。 第三,通过扩展NSSEL(New Secondary Structure Element Labels,NSSEL)标签,创建了一套能够描述伪结结构信息的eNSSEL(extended NSSEL,eNSSEL)标签。一条RNA分子序列中的所有碱基都可以使用eNSSEL标签进行标记,从另一个角度来理解,即:任意一个碱基都可以被分类为某一个标签,因此,一条原始的RNA分子序列能与一条eNSSEL标签序列一一对应。由于eNSSEL标签携带了结构信息,因此,对于某一个RNA分子而言,只要得到其对应的标签序列,就可以知道其二级结构的组成。根据该思想,建立了基于SVMs(support vector machines,SVMs)的分类预测模型。该模型通过有效训练后,在可接受的预测精度范围里具有较低的计算复杂度,能有效地解决传统算法中存在的计算复杂性问题,为预测长链分子提供了一种全新的思路。
【学位授予单位】:重庆大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP301.6

【引证文献】
中国博士学位论文全文数据库 前3条
1 董浩;RNA二级结构预测方法研究[D];吉林大学;2011年
2 邢翀;RNA二级结构预测算法的研究[D];吉林大学;2012年
3 宋佳;机器学习方法在生物序列分析中的应用[D];浙江大学;2013年
中国硕士学位论文全文数据库 前4条
1 严国权;芯片探针杂交效率的影响因素分析[D];浙江理工大学;2010年
2 李杰;RNA二级结构表示及相似性分析研究[D];吉林大学;2011年
3 张骏;RNA二级结构预测的蛙跳算法及其并行化[D];福建农林大学;2012年
4 苏启龙;基于FPGA的并行RNA二级结构预测加速算法研究[D];上海交通大学;2013年
【参考文献】
中国期刊全文数据库 前10条
1 王睿;;关于支持向量机参数选择方法分析[J];重庆师范大学学报(自然科学版);2007年02期
2 邹权;郭茂祖;张涛涛;;RNA二级结构预测方法综述[J];电子学报;2008年02期
3 宁正元;林世强;;RNA二级结构预测方法[J];福建农林大学学报(自然科学版);2007年01期
4 黄华娟;周永权;;改进型人工鱼群算法及复杂函数全局优化方法[J];广西师范大学学报(自然科学版);2008年01期
5 樊玮;粒子群优化方法及其实现[J];航空计算技术;2004年03期
6 胡桂武;彭宏;;基于免疫粒子群集成的RNA二级结构预测算法[J];计算机工程与应用;2007年03期
7 李恒武;朱大铭;纪秀花;;RNA二级结构预测算法的设计与实现[J];计算机工程与科学;2006年07期
8 刘琦;张引;叶修梓;俞荣栋;;基于离散Hopfield网络求解极大独立集的茎区选择算法以及在RNA二级结构预测中的应用[J];计算机学报;2008年01期
9 段海滨;王道波;于秀芬;;几种新型仿生优化算法的比较研究[J];计算机仿真;2007年03期
10 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
【共引文献】
中国期刊全文数据库 前10条
1 郭苗莉,朱江波,陈蓉芳,张天宝;应用基因表达谱芯片研究MNNG诱致小鼠胚胎畸形肢体基因表达的变化[J];癌变.畸变.突变;2005年02期
2 王朝霞;生物信息学:一门前沿交叉学科[J];安徽教育学院学报;2002年06期
3 王东霞;张楠;路晓丽;;基于育种算法的SVM参数优化[J];安徽大学学报(自然科学版);2009年04期
4 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
5 张艳;张海军;;基于DSP的多通道超声波连续测厚系统的研究[J];安徽工程科技学院学报(自然科学版);2008年03期
6 程子华;;Dmrt基因的功能和特点[J];安徽农业科学;2006年05期
7 张树林;何德;朱高浦;刘杰;莫鹏巧;;生物信息学在农业上的应用[J];安徽农业科学;2007年22期
8 符保龙;;RBF网络在农业病虫害预测中的应用研究[J];安徽农业科学;2008年01期
9 李磊;孙卉;翟秋敏;郭志永;;RBF神经网络在平顶山市地表水评价中的应用[J];安徽农业科学;2008年26期
10 张帅;李琳一;袁涛;王梅玉;;信息技术在害虫时空动态模拟中的应用[J];安徽农业科学;2009年07期
中国重要会议论文全文数据库 前10条
1 宋海鹰;桂卫华;阳春华;;基于核偏最小二乘的简约最小二乘支持向量机及其应用研究[A];第二十六届中国控制会议论文集[C];2007年
2 顾小军;杨世锡;钱苏翔;;基于支持向量机的旋转机械多类故障识别研究[A];第二十六届中国控制会议论文集[C];2007年
3 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
4 姜明辉;袁绪川;;基于GA优化的个人信用评估SVM模型[A];第二十六届中国控制会议论文集[C];2007年
5 崔志华;蔡星娟;曾建潮;孙国基;;基于预测速度的改进微粒群算法[A];第二十六届中国控制会议论文集[C];2007年
6 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
7 田艳兵;;BP算法和PSO算法在神经网络中的研究[A];第二十九届中国控制会议论文集[C];2010年
8 王新宇;孙冠;韩冬;张婷;;基于一种改进神经网络的数据手套手势识别[A];第二十九届中国控制会议论文集[C];2010年
9 吴静珠;刘翠玲;孙晓容;;支持向量机在近红外光谱检测技术中的应用研究[A];第二十九届中国控制会议论文集[C];2010年
10 何平;潘国峰;李琳;夏克文;赵红东;;基于LS-SVR的压力传感器温度补偿[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 王勇;细基格孢属、匍柄霉属及其近似属的形态学与分子系统学研究[D];山东农业大学;2010年
2 母丽华;煤矿安全预警系统的方法研究[D];哈尔滨工程大学;2010年
3 谭佳琳;粒子群优化算法研究及其在海底地形辅助导航中的应用[D];哈尔滨工程大学;2010年
4 冷欣;船用增压锅炉汽包水位预测控制方法研究[D];哈尔滨工程大学;2009年
5 王鑫;Pre-mRNA选择性剪接调控机制研究[D];哈尔滨工程大学;2009年
6 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
7 朱怡;潜艇航行训练模拟器模型简化与参数优化研究[D];哈尔滨工程大学;2009年
8 朱广平;混响干扰中的信号检测技术研究[D];哈尔滨工程大学;2009年
9 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
10 杨宁;计算机辅助卷烟配方设计关键技术研究[D];中国海洋大学;2010年
中国硕士学位论文全文数据库 前10条
1 展慧;基于多源信息融合技术的板栗分级检测方法研究[D];华中农业大学;2010年
2 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
3 柳枝华;微粒群优化算法的改进及应用[D];南昌航空大学;2010年
4 刘棉;人机划拳系统的实现[D];山东科技大学;2010年
5 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
6 蒲锰;非侵入式矿井提升机PLC电控系统实时故障诊断方法的研究[D];山东科技大学;2010年
7 安文娟;Fisher和支持向量综合分类器[D];辽宁师范大学;2010年
8 姜成玉;基于支持向量机的时间序列预测[D];辽宁师范大学;2010年
9 严国权;芯片探针杂交效率的影响因素分析[D];浙江理工大学;2010年
10 吴家瑞;服装产品加工成本快速估算方法研究[D];浙江理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 毛长飞;顾乾屏;陈坚;罗升平;;基于有吸收态的马尔可夫链的贷款迁移分析[J];山东工商学院学报;2007年05期
2 彭梅;;基于马尔可夫链的商品销售预测模型[J];达县师范高等专科学校学报(自然科学);2006年05期
3 邹权;郭茂祖;张涛涛;;RNA二级结构预测方法综述[J];电子学报;2008年02期
4 阮庆,王逸蔷;主成分分析方法在BP学习中的应用(英文)[J];复旦学报(自然科学版);2005年02期
5 宁正元;林世强;;RNA二级结构预测方法[J];福建农林大学学报(自然科学版);2007年01期
6 林素文,王彦声,谢志鸣;高校教师队伍规模预测研究[J];福建医科大学学报(社会科学版);2005年01期
7 王宏健;复等位基因遗传疾病的数学模型[J];福州大学学报(自然科学版);1995年05期
8 程向阳;;马尔可夫链模型在教育评估中的应用[J];大学数学;2007年02期
9 刘岩;刘芳;;马尔可夫链在人民币汇率预测中的应用[J];中国管理信息化(综合版);2007年03期
10 章亚娟,俞爱君;Markov链在高校文献资源采购预测中的应用[J];哈尔滨师范大学自然科学学报;2002年04期
中国重要报纸全文数据库 前1条
1 中国科学院生物物理研究所 陈润生;[N];科技日报;2001年
中国博士学位论文全文数据库 前6条
1 董浩;RNA二级结构预测方法研究[D];吉林大学;2011年
2 余军;RNA二级结构预测算法研究[D];吉林大学;2011年
3 夏飞;生物序列分析算法硬件加速器关键技术研究[D];国防科学技术大学;2011年
4 刘海军;RNA二级结构预测的建模及其应用研究[D];上海大学;2005年
5 刘琦;RNA二级结构的若干计算生物学问题研究[D];浙江大学;2008年
6 方小永;基于比较序列分析的RNA二级结构预测与评估[D];国防科学技术大学;2007年
中国硕士学位论文全文数据库 前10条
1 林娟;RNA二级结构预测的群智能优化算法研究[D];福建农林大学;2011年
2 雷国庆;面向生物信息学结构预测领域的算法加速器设计[D];国防科学技术大学;2010年
3 包文琦;可重构宏流水加速器的研究与实现[D];上海交通大学;2011年
4 郭碧洲;基于软件表决的三模冗余星载计算机体系结构研究与设计[D];上海交通大学;2011年
5 郭颖;RNA的二级结构[D];大连理工大学;2005年
6 刘维;生物信息学中的并行处理[D];扬州大学;2007年
7 陆健;基于动态权重匹配的RNA二级结构预测算法[D];江苏大学;2007年
8 单夫一;RNA二级结构图形表示法及相似性分析研究[D];湖南大学;2007年
9 马艳;并行进化算法的研究与应用[D];江南大学;2007年
10 李誌;基于马尔科夫链的RNA二级结构预测[D];吉林大学;2007年
【二级引证文献】
中国期刊全文数据库 前2条
1 林航;李金铭;;基于改进的神经网络的RNA二级结构预测[J];赤峰学院学报(自然科学版);2014年05期
2 陈飞;郝福珍;;基于CUDA对RNA二级结构预测的并行研究[J];计算机工程与设计;2014年01期
中国博士学位论文全文数据库 前1条
1 邢翀;RNA二级结构预测算法的研究[D];吉林大学;2012年
中国硕士学位论文全文数据库 前3条
1 张书欣;生物信息学若干问题研究报告[D];吉林大学;2012年
2 苏启龙;基于FPGA的并行RNA二级结构预测加速算法研究[D];上海交通大学;2013年
3 王魁祎;基于能量优化的RNA二级结构预测[D];吉林大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 董景荣;汇率预报的非线性组合建模与预测方法研究[J];重庆师范学院学报(自然科学版);2003年03期
2 李晓磊,钱积新;基于分解协调的人工鱼群优化算法研究[J];电路与系统学报;2003年01期
3 彭喜元,彭宇,戴毓丰;群智能理论及应用[J];电子学报;2003年S1期
4 李兢,刘长林,申石虎;关于图的极大独立集的理论及生成方法[J];电子学报;1995年08期
5 张美玉;黄翰;杨晓伟;郝志峰;;求解线性运输问题的新型进化算法[J];广西师范大学学报(自然科学版);2006年04期
6 王鹏,朱小燕;基于RBF核的SVM的模型选择及其应用[J];计算机工程与应用;2003年24期
7 付微,黄竞伟,徐丽;RNA二级结构表示方法及其转换算法[J];计算机工程与应用;2004年14期
8 李宏;焦永昌;张莉;;求解全局优化问题的混合智能算法[J];计算机工程与应用;2006年16期
9 杨燕,靳蕃,Kamel M;微粒群优化算法研究现状及其进展[J];计算机工程;2004年21期
10 李有梅,徐宗本,孙建永;一类求解最大独立集问题的混合神经演化算法[J];计算机学报;2003年11期
中国博士学位论文全文数据库 前1条
1 李艳君;拟生态系统算法及其在工业过程控制中的应用[D];浙江大学;2001年
中国硕士学位论文全文数据库 前1条
1 郑晓鸣;人工鱼群算法的改进及应用[D];上海海事大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 唐四薪;刘艳波;尹军;;文法推断RNA二级结构的研究进展[J];生物信息学;2008年04期
2 梁成;骆嘉伟;李仁发;;一种新的RNA二级结构特征序列表示及相似性分析[J];计算机应用研究;2011年03期
3 胡桂武;彭宏;;利用混沌差分进化算法预测RNA二级结构[J];计算机科学;2007年09期
4 付微,黄竞伟,徐丽;RNA二级结构表示方法及其转换算法[J];计算机工程与应用;2004年14期
5 单夫一;骆嘉伟;;一种新的RNA二级结构的三维图形表示[J];武汉理工大学学报(信息与管理工程版);2007年05期
6 高世乐;丁克诠;;含假结RNA二级结构类的图语法[J];计算机工程与应用;2008年02期
7 夏培明;张岩;;基于茎区的自由能算法预测RNA二级结构[J];微计算机信息;2009年09期
8 唐四薪;周勇;邹赛;;基于词汇化随机文法模型的RNA二级结构预测[J];计算机工程与科学;2009年03期
9 何静媛;邹东升;何中市;;RNA二级结构预测的自适应鱼群算法模型[J];系统仿真学报;2010年06期
10 李恒武;朱大铭;纪秀花;;RNA二级结构预测算法的设计与实现[J];计算机工程与科学;2006年07期
中国重要会议论文全文数据库 前2条
1 宋丹丹;邓志东;;基于模糊动态规划的RNA折叠算法的研究与实现[A];2005年中国智能自动化会议论文集[C];2005年
2 王见杨;黄可威;毛小红;陆长德;;九种家蚕病原性微孢子虫核糖体小亚单位RNA基因的克隆测序及亲缘关系分析[A];中国蚕学会养蚕与蚕生理病理学术讨论会论文汇编[C];2000年
中国博士学位论文全文数据库 前10条
1 廖波;计算分子生物学中若干问题研究[D];大连理工大学;2004年
2 高世乐;含假结RNA二级结构图的语法及拓扑分类[D];大连理工大学;2008年
3 刘忠钰;登革病毒C基因RNA二级结构及编码蛋白在病毒复制中的作用[D];中国人民解放军军事医学科学院;2009年
4 白凤兰;生物序列的图形表示及其应用[D];大连理工大学;2006年
5 刘立伟;蛋白质及RNA结构比较与进化分析[D];大连理工大学;2008年
6 郭颖;生物序列的几何刻画及应用[D];大连理工大学;2008年
7 方小永;基于比较序列分析的RNA二级结构预测与评估[D];国防科学技术大学;2007年
8 王文文;RNA二级结构的计数问题及其进化分析[D];大连理工大学;2009年
9 黄耀伟;传染性法氏囊病病毒全基因组克隆及反向遗传系统的建立[D];浙江大学;2002年
10 洪海燕;人干细胞因子在大肠杆菌中的高效表达及其在红系分化中功能的初步研究[D];第二军医大学;2002年
中国硕士学位论文全文数据库 前10条
1 胡名刚;基于真实结构特征的RNA二级结构预测方法研究[D];吉林大学;2014年
2 郭颖;RNA的二级结构[D];大连理工大学;2005年
3 杨红;RNA二级结构的计数[D];大连理工大学;2006年
4 李誌;基于马尔科夫链的RNA二级结构预测[D];吉林大学;2007年
5 刘振栋;预测RNA二级结构的快速计算方法的研究[D];山东大学;2005年
6 陆健;基于动态权重匹配的RNA二级结构预测算法[D];江苏大学;2007年
7 牟敬君;生物序列的图形表示及相似性分析[D];中国海洋大学;2008年
8 杨泽民;金藻类部分类群的分子系统学研究[D];暨南大学;2005年
9 彭政;带假结的RNA二级结构预测算法研究[D];湖南大学;2008年
10 杨中汉;高脂血症患者脂蛋白脂酶基因异常的初步研究[D];暨南大学;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026