收藏本站
《重庆大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

RNA二级结构预测算法的研究

何静媛  
【摘要】: RNA(Ribonucleic Acid,RNA)分子在生物细胞中不仅充当着遗传信息的载体和传递工具,还具有催化RNA的剪接,加工和修饰RNA前体,调控基因表达和生物体的生长发育等一系列重要的功能,而功能与结构是密切相关的,因此对RNA分子结构的研究就成为分子生物学的一个重要领域。由于RNA分子具有降解速度快,难以结晶等特点,通过X射线晶体衍射和核磁共振等实验方法去测定RNA分子的立体结构花费的成本高、时间长,虽然测得的结果精确可靠,可是面对当前海量的生物序列,实验方法显然跟不上要求,因此RNA二级结构预测就成为研究RNA分子结构的主要手段。RNA二级结构预测是指借助于计算机手段和各种数学方法从理论上去预测RNA的空间结构,可为揭示RNA结构与功能的关系提供重要信息,大大提高认识RNA空间结构的效率。 论文对目前主流的RNA二级结构预测算法的理论和实现方法进行了细致的研究。通过对基于热力学的预测方法(包括Zuker的最小自由能算法、遗传模拟退火算法、Hopfield神经网络方法、免疫粒子群算法)和比较序列分析方法(协同变异预测模型、随机上下文无关语法预测)以及基于机器学习的分类预测方法的分析,对这些算法存在的优缺点进行了比较研究,总结出了RNA结构预测方法发展的趋势和要求,为本文的预测算法奠定了理论和实验基础。 首先论文分析了人工鱼群智能算法在优化问题中的优势和不足,并针对基本人工鱼群算法在解决离散问题的过程中存在的的缺陷进行了相应改进,首次将鱼群算法应用到RNA二级结构预测问题中,建立了一种基于人工鱼群算法的最小自由能算法模型。在对算法编码实现时,采用集合表示状态点,能有效地缩小搜索空间,有利于算法在较短时间内找到目标解。仿真实验与传统的基于最小自由能的相关算法进行了比较研究,结果表明,使用改进鱼群算法进行RNA序列的二级结构预测能获得较理想的预测效果,能有效减少计算量、节省计算时间,特别当待测序列长度大于500时,鱼群算法在收敛速度上有着较明显优势。 其次,研究了粒子群优化算法在组合优化问题中的应用背景,针对基本粒子群算法的早熟收敛,容易陷入局部最优且搜索精度不高等缺点,进行了相应的改进,提出了局部精英粒子群算法,在该算法中,通过改变粒子的邻居拓扑结构,使每个粒子拥有固定的局部邻居,每次迭代都会根据自身在邻居中的地位和状态以及历史最优值来调整下一步的状态。由于有效地保持粒子的多样性,使得算法有较好地跳出局部极值的特性。 本文根据局部精英粒子群算法的思想构建了一套基于最小自由能思想的RNA二级结构预测模型。在对算法进行编码时,使用集合来表示粒子的状态,巧妙地将粒子运动的速度和状态函数使用集合之间的运算来重载,避免了传统粒子群算法参数选择的烦恼。实验数据有力地支持了改进后的粒子群算法和新的粒子运动状态编码方式。 第三,通过扩展NSSEL(New Secondary Structure Element Labels,NSSEL)标签,创建了一套能够描述伪结结构信息的eNSSEL(extended NSSEL,eNSSEL)标签。一条RNA分子序列中的所有碱基都可以使用eNSSEL标签进行标记,从另一个角度来理解,即:任意一个碱基都可以被分类为某一个标签,因此,一条原始的RNA分子序列能与一条eNSSEL标签序列一一对应。由于eNSSEL标签携带了结构信息,因此,对于某一个RNA分子而言,只要得到其对应的标签序列,就可以知道其二级结构的组成。根据该思想,建立了基于SVMs(support vector machines,SVMs)的分类预测模型。该模型通过有效训练后,在可接受的预测精度范围里具有较低的计算复杂度,能有效地解决传统算法中存在的计算复杂性问题,为预测长链分子提供了一种全新的思路。
【学位授予单位】:重庆大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP301.6

【引证文献】
中国博士学位论文全文数据库 前2条
1 董浩;RNA二级结构预测方法研究[D];吉林大学;2011年
2 邢翀;RNA二级结构预测算法的研究[D];吉林大学;2012年
中国硕士学位论文全文数据库 前3条
1 严国权;芯片探针杂交效率的影响因素分析[D];浙江理工大学;2010年
2 李杰;RNA二级结构表示及相似性分析研究[D];吉林大学;2011年
3 张骏;RNA二级结构预测的蛙跳算法及其并行化[D];福建农林大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 王睿;;关于支持向量机参数选择方法分析[J];重庆师范大学学报(自然科学版);2007年02期
2 邹权;郭茂祖;张涛涛;;RNA二级结构预测方法综述[J];电子学报;2008年02期
3 宁正元;林世强;;RNA二级结构预测方法[J];福建农林大学学报(自然科学版);2007年01期
4 黄华娟;周永权;;改进型人工鱼群算法及复杂函数全局优化方法[J];广西师范大学学报(自然科学版);2008年01期
5 樊玮;粒子群优化方法及其实现[J];航空计算技术;2004年03期
6 胡桂武;彭宏;;基于免疫粒子群集成的RNA二级结构预测算法[J];计算机工程与应用;2007年03期
7 李恒武;朱大铭;纪秀花;;RNA二级结构预测算法的设计与实现[J];计算机工程与科学;2006年07期
8 刘琦;张引;叶修梓;俞荣栋;;基于离散Hopfield网络求解极大独立集的茎区选择算法以及在RNA二级结构预测中的应用[J];计算机学报;2008年01期
9 段海滨;王道波;于秀芬;;几种新型仿生优化算法的比较研究[J];计算机仿真;2007年03期
10 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
【共引文献】
中国期刊全文数据库 前10条
1 郭苗莉,朱江波,陈蓉芳,张天宝;应用基因表达谱芯片研究MNNG诱致小鼠胚胎畸形肢体基因表达的变化[J];癌变.畸变.突变;2005年02期
2 王朝霞;生物信息学:一门前沿交叉学科[J];安徽教育学院学报;2002年06期
3 王东霞;张楠;路晓丽;;基于育种算法的SVM参数优化[J];安徽大学学报(自然科学版);2009年04期
4 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
5 张艳;张海军;;基于DSP的多通道超声波连续测厚系统的研究[J];安徽工程科技学院学报(自然科学版);2008年03期
6 程子华;;Dmrt基因的功能和特点[J];安徽农业科学;2006年05期
7 张树林;何德;朱高浦;刘杰;莫鹏巧;;生物信息学在农业上的应用[J];安徽农业科学;2007年22期
8 符保龙;;RBF网络在农业病虫害预测中的应用研究[J];安徽农业科学;2008年01期
9 李磊;孙卉;翟秋敏;郭志永;;RBF神经网络在平顶山市地表水评价中的应用[J];安徽农业科学;2008年26期
10 张帅;李琳一;袁涛;王梅玉;;信息技术在害虫时空动态模拟中的应用[J];安徽农业科学;2009年07期
中国重要会议论文全文数据库 前10条
1 宋海鹰;桂卫华;阳春华;;基于核偏最小二乘的简约最小二乘支持向量机及其应用研究[A];第二十六届中国控制会议论文集[C];2007年
2 顾小军;杨世锡;钱苏翔;;基于支持向量机的旋转机械多类故障识别研究[A];第二十六届中国控制会议论文集[C];2007年
3 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
4 姜明辉;袁绪川;;基于GA优化的个人信用评估SVM模型[A];第二十六届中国控制会议论文集[C];2007年
5 崔志华;蔡星娟;曾建潮;孙国基;;基于预测速度的改进微粒群算法[A];第二十六届中国控制会议论文集[C];2007年
6 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
7 田艳兵;;BP算法和PSO算法在神经网络中的研究[A];第二十九届中国控制会议论文集[C];2010年
8 王新宇;孙冠;韩冬;张婷;;基于一种改进神经网络的数据手套手势识别[A];第二十九届中国控制会议论文集[C];2010年
9 吴静珠;刘翠玲;孙晓容;;支持向量机在近红外光谱检测技术中的应用研究[A];第二十九届中国控制会议论文集[C];2010年
10 何平;潘国峰;李琳;夏克文;赵红东;;基于LS-SVR的压力传感器温度补偿[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 王勇;细基格孢属、匍柄霉属及其近似属的形态学与分子系统学研究[D];山东农业大学;2010年
2 母丽华;煤矿安全预警系统的方法研究[D];哈尔滨工程大学;2010年
3 谭佳琳;粒子群优化算法研究及其在海底地形辅助导航中的应用[D];哈尔滨工程大学;2010年
4 冷欣;船用增压锅炉汽包水位预测控制方法研究[D];哈尔滨工程大学;2009年
5 王鑫;Pre-mRNA选择性剪接调控机制研究[D];哈尔滨工程大学;2009年
6 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
7 朱怡;潜艇航行训练模拟器模型简化与参数优化研究[D];哈尔滨工程大学;2009年
8 朱广平;混响干扰中的信号检测技术研究[D];哈尔滨工程大学;2009年
9 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
10 杨宁;计算机辅助卷烟配方设计关键技术研究[D];中国海洋大学;2010年
中国硕士学位论文全文数据库 前10条
1 展慧;基于多源信息融合技术的板栗分级检测方法研究[D];华中农业大学;2010年
2 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
3 柳枝华;微粒群优化算法的改进及应用[D];南昌航空大学;2010年
4 刘棉;人机划拳系统的实现[D];山东科技大学;2010年
5 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
6 蒲锰;非侵入式矿井提升机PLC电控系统实时故障诊断方法的研究[D];山东科技大学;2010年
7 安文娟;Fisher和支持向量综合分类器[D];辽宁师范大学;2010年
8 姜成玉;基于支持向量机的时间序列预测[D];辽宁师范大学;2010年
9 严国权;芯片探针杂交效率的影响因素分析[D];浙江理工大学;2010年
10 吴家瑞;服装产品加工成本快速估算方法研究[D];浙江理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 毛长飞;顾乾屏;陈坚;罗升平;;基于有吸收态的马尔可夫链的贷款迁移分析[J];山东工商学院学报;2007年05期
2 彭梅;;基于马尔可夫链的商品销售预测模型[J];达县师范高等专科学校学报(自然科学);2006年05期
3 邹权;郭茂祖;张涛涛;;RNA二级结构预测方法综述[J];电子学报;2008年02期
4 阮庆,王逸蔷;主成分分析方法在BP学习中的应用(英文)[J];复旦学报(自然科学版);2005年02期
5 宁正元;林世强;;RNA二级结构预测方法[J];福建农林大学学报(自然科学版);2007年01期
6 林素文,王彦声,谢志鸣;高校教师队伍规模预测研究[J];福建医科大学学报(社会科学版);2005年01期
7 王宏健;复等位基因遗传疾病的数学模型[J];福州大学学报(自然科学版);1995年05期
8 程向阳;;马尔可夫链模型在教育评估中的应用[J];大学数学;2007年02期
9 刘岩;刘芳;;马尔可夫链在人民币汇率预测中的应用[J];中国管理信息化(综合版);2007年03期
10 章亚娟,俞爱君;Markov链在高校文献资源采购预测中的应用[J];哈尔滨师范大学自然科学学报;2002年04期
中国重要报纸全文数据库 前1条
1 中国科学院生物物理研究所 陈润生;[N];科技日报;2001年
中国博士学位论文全文数据库 前3条
1 董浩;RNA二级结构预测方法研究[D];吉林大学;2011年
2 刘海军;RNA二级结构预测的建模及其应用研究[D];上海大学;2005年
3 刘琦;RNA二级结构的若干计算生物学问题研究[D];浙江大学;2008年
中国硕士学位论文全文数据库 前10条
1 林娟;RNA二级结构预测的群智能优化算法研究[D];福建农林大学;2011年
2 郭颖;RNA的二级结构[D];大连理工大学;2005年
3 刘维;生物信息学中的并行处理[D];扬州大学;2007年
4 陆健;基于动态权重匹配的RNA二级结构预测算法[D];江苏大学;2007年
5 单夫一;RNA二级结构图形表示法及相似性分析研究[D];湖南大学;2007年
6 马艳;并行进化算法的研究与应用[D];江南大学;2007年
7 李誌;基于马尔科夫链的RNA二级结构预测[D];吉林大学;2007年
8 万单领;基于GPU加速的并行粒子群算法及其应用[D];大连理工大学;2008年
9 彭政;带假结的RNA二级结构预测算法研究[D];湖南大学;2008年
10 孙守航;异构多核处理器OpenMP编译实现与优化[D];国防科学技术大学;2007年
【二级引证文献】
中国博士学位论文全文数据库 前1条
1 邢翀;RNA二级结构预测算法的研究[D];吉林大学;2012年
中国硕士学位论文全文数据库 前1条
1 张书欣;生物信息学若干问题研究报告[D];吉林大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 董景荣;汇率预报的非线性组合建模与预测方法研究[J];重庆师范学院学报(自然科学版);2003年03期
2 李晓磊,钱积新;基于分解协调的人工鱼群优化算法研究[J];电路与系统学报;2003年01期
3 彭喜元,彭宇,戴毓丰;群智能理论及应用[J];电子学报;2003年S1期
4 李兢,刘长林,申石虎;关于图的极大独立集的理论及生成方法[J];电子学报;1995年08期
5 张美玉;黄翰;杨晓伟;郝志峰;;求解线性运输问题的新型进化算法[J];广西师范大学学报(自然科学版);2006年04期
6 王鹏,朱小燕;基于RBF核的SVM的模型选择及其应用[J];计算机工程与应用;2003年24期
7 付微,黄竞伟,徐丽;RNA二级结构表示方法及其转换算法[J];计算机工程与应用;2004年14期
8 李宏;焦永昌;张莉;;求解全局优化问题的混合智能算法[J];计算机工程与应用;2006年16期
9 杨燕,靳蕃,Kamel M;微粒群优化算法研究现状及其进展[J];计算机工程;2004年21期
10 李有梅,徐宗本,孙建永;一类求解最大独立集问题的混合神经演化算法[J];计算机学报;2003年11期
中国博士学位论文全文数据库 前1条
1 李艳君;拟生态系统算法及其在工业过程控制中的应用[D];浙江大学;2001年
中国硕士学位论文全文数据库 前1条
1 郑晓鸣;人工鱼群算法的改进及应用[D];上海海事大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 田建忠;王威;谢梅芳;;基于粒子群算法的支持向量机训练和实现方法[J];武汉理工大学学报(信息与管理工程版);2007年10期
2 袁小艳;刘爱伦;;基于PSO算法的支持向量机核参数选择问题研究[J];自动化技术与应用;2007年05期
3 李晓鹏;;基于PSO训练SVM的人脸识别[J];电脑知识与技术(学术交流);2007年08期
4 王伟;;AHP和SVM组合的网络安全评估研究[J];计算机仿真;2011年03期
5 杨富华;彭钢;;PCA-SVM在网络入侵检测中的仿真研究[J];计算机仿真;2011年07期
6 刘瑞兰;刘蔚;;基于支持向量机和粒子群算法的励磁系统频域辨识[J];南京邮电大学学报(自然科学版);2010年05期
7 姜明辉;袁绪川;冯玉强;;PSO-SVM模型的构建与应用[J];哈尔滨工业大学学报;2009年02期
8 范启亮;章瑶;刘春波;潘丰;;基于PSO-MKSVM发酵过程建模与补料优化控制[J];自动化与仪表;2009年05期
9 曾联明;吴湘滨;刘鹏;;利用粒子群算法缩减大规模数据集SVM训练样本[J];计算机科学;2009年09期
10 向昌盛;周子英;张林峰;;相空间重构和支持向量机参数联合优化研究[J];湖南科技大学学报(自然科学版);2010年04期
中国重要会议论文全文数据库 前10条
1 姜谙男;侯林波;伍平;;基于粒子群支持向量机的三维初始地应力反分析[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
2 林杰华;张斌;李冬森;宋华茂;余志强;王浩;;支持向量机在电力客户信用评级中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
3 蒋铁军;张怀强;李积源;;多变量系统预测的支持向量机方法研究[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年
4 朱珍德;李红波;尚剑飞;刘金辉;;基于支持向量机理论的矿山动采巷道围岩变形预测分析[A];自主创新与持续增长第十一届中国科协年会论文集(1)[C];2009年
5 黄淑云;孙兴玉;梁汝萍;邱建丁;;基于小波支持向量机预测蛋白质亚细胞定位研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
6 谢湘;匡镜明;;支持向量机在语音识别中的应用研究[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
7 涂冬成;薛龙;刘木华;赵进辉;沈杰;吁芳;;基于支持向量机的鹅肉肉色客观评定研究[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年
8 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
9 师旭超;巴松涛;;基于支持向量机方法的深基坑变形预测[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(上册)[C];2004年
10 张军;;支持向量机方法在地下水位干扰排除中的初步应用[A];2007年地震流体学术研讨会论文摘要集[C];2007年
中国重要报纸全文数据库 前10条
1 课题主持人 李心丹 课题协调人 上海证券交易所 施东晖 傅浩 课题研究员 宋素荣 查晓磊 宾红辉 张许宏 郭静静 黄隽 南京大学工程管理学院;内幕交易与市场操纵的行为动机与判别监管研究[N];中国证券报;2007年
2 李水根;计算机详解配伍与药效关系[N];健康报;2005年
3 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
4 YMG记者 李仁 通讯员 曲华明 孙运智;我市九项目进入省“盘子”[N];烟台日报;2010年
5 上海大学理学院教授、副院长 陆文聪;酷爱化学 孜孜以求[N];中国化工报;2006年
6 ;选择合适的数据挖掘算法[N];计算机世界;2007年
7 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
8 周颖;王米渠与中医心理学[N];中国中医药报;2006年
9 记者 张云普通讯员 全攀峰 安强强;大庆物探深度域地震资料岩性解释技术获得五大突破[N];中国石油报;2008年
10 本报记者 冯治恩;敢与“雷公”试比高[N];铜川日报;2008年
中国博士学位论文全文数据库 前10条
1 何静媛;RNA二级结构预测算法的研究[D];重庆大学;2009年
2 孙亮;若干机器学习算法的研究与应用[D];吉林大学;2012年
3 杜小芳;基于CPFR的农产品采购模型研究[D];华中科技大学;2005年
4 刘育明;动态过程数据的多变量统计监控方法研究[D];浙江大学;2006年
5 栾锋;支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究[D];兰州大学;2006年
6 孙薇;市场条件下抽水蓄能电站效益综合评价及运营模式研究[D];华北电力大学(河北);2007年
7 常群;支持向量机的核方法及其模型选择[D];哈尔滨工业大学;2007年
8 朱燕飞;锌钡白回转窑煅烧过程智能建模研究[D];华南理工大学;2005年
9 田英杰;支持向量回归机及其应用研究[D];中国农业大学;2005年
10 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
中国硕士学位论文全文数据库 前10条
1 张红梅;基于支持向量机的电力系统短期负荷预测研究[D];河海大学;2006年
2 谢晓娣;基于改进支持向量机的配电网线损计算[D];合肥工业大学;2006年
3 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
4 李红英;支持向量分类机的核函数研究[D];重庆大学;2009年
5 张楠;关于支持向量机中的参数优化的研究[D];西北大学;2008年
6 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
7 柳一鸣;自适应量子行为粒子群算法及其在图像分类中的应用研究[D];浙江大学;2011年
8 杨立标;基于混合优化策略的粒子群算法及其应用研究[D];哈尔滨工程大学;2010年
9 陈琳玲;基于简化粒子群算法的测试数据自动生成方法研究[D];西南大学;2010年
10 赵辛欣;随机聚焦粒子群算法在机组组合中的应用[D];西南交通大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026