收藏本站
《重庆大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于信号处理技术的生物序列相似性分析与基因识别

王世元  
【摘要】:生物信息学是一门新兴的交叉学科。它是以计算机和网络为工具,采用数学和信息科学等理论和方法研究核酸、蛋白质等生物大分子。生物信息学的研究能够帮助我们进一步探索生物进化和生命本质等重大问题。同时,生命中蕴藏的巨大信息也将进一步促进其他学科的发展。 本文旨在探索信号处理技术在生物信息学中的应用。主要研究内容包括生物序列的相似性分析和基因识别。 本文的研究成果可概括为: ①鉴于RNA二级结构的结构特征主要体现在碱基对中,本文以碱基对为出发点,提取出RNA二级结构序列所对应的基序列,并借鉴信号处理技术中的正交投影和小波变换的思想在所得的基序列上设计碱基对变换,进而构建序列间的相似性函数。该函数结合了序列间碱基对变换后结果之间的差值及其对应的位置差值,因此能够全面地比较序列间的差异,从而实现RNA二级结构的相似性分析。基于碱基对变换的相似性分析方法的时间复杂度较小。除此之外,该方法获得的相似性分析结果之间的差异较大,有利于进一步实现所得结果的聚类分析。 ②基于信息论中的汉明距离,本文提出了一种具有普适性的双边相似性函数,使之能够适应DNA序列、RNA二级结构序列和蛋白质序列的相似性分析。该方法不需要对生物序列进行数值映射,能够较好地提取生物序列中的信息,以较低的时间复杂度统一地实现三种生物序列的相似性分析,证明了双边相似性函数的有效性和普适性。尤其对RNA二级结构序列的相似性分析,不考虑结构信息和考虑结构信息的分析结果近似一致。这样就简化了RNA二级结构序列的相似性分析过程。 ③基于符号动力学原理,本文提出了一种新的DNA序列表示方法。该表示方法不仅具有良好的数值特征,能够挖掘DNA序列中的混沌特征,而且还能够实现序列的可视化表示。新表示方法的可视化特征能够实现DNA序列的图形比对和密码子比对。基于密码子比对的结果,构建序列间的相似百分比有效地实现了DNA序列的相似性分析。基于几何中心构成的特征向量,新表示方法同样能够有效地实现DNA序列的相似性分析,表明符号动力学原理能够有效地应用在DNA序列的分析中。 ④结合RNA二级结构序列与DNA序列的不同点,改进DNA序列的符号动力学表示方法使之适合RNA二级结构序列。其出发点是RNA二级结构的结构稳定性主要是由碱基对的自由能决定。重点讨论了改进后的RNA二级结构序列表示方法中的截取长度对序列相似性分析结果的影响。在时域中,结合矩阵不变量,利用改进后的表示方法定量地实现了RNA二级结构序列的相似性分析。为了进一步验证改进后的表示方法的有效性,对表示结果进行离散傅里叶变换,从频域定性地分析了RNA二级结构序列的相似性。实验结果表明符号动力学原理同样能够有效地应用在RNA二级结构序列的相似性分析中。 ⑤结合DNA序列的符号动力学表示方法和Z曲线表示方法,本文利用基因编码区的周期-3特性设计了一种基于扩展卡尔曼滤波器的基因识别模型。该方法能够利用扩展卡尔曼滤波器的预测能力,有效地识别基因的外显子位置。同时,为了降低识别结果中的背景噪声,对识别结果采用加窗处理的方法,进一步提高了基因编码区和非编码区的识别效果。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 沈世镒;生物序列的语义分析与第二密码规则的探索[J];工程数学学报;2004年05期
2 黄永莲,孙世军;两个生物序列最短公共超序列的动态规划算法[J];湘潭师范学院学报(自然科学版);2005年03期
3 沈世镒,余涛,开波,阮吉寿;生物序列的语义分析与第二密码规则的探索(续)[J];工程数学学报;2004年06期
4 李玉鑑;生物序列的邻位约束比较方法[J];北京工业大学学报;2005年05期
5 杨洁;刘海;;生物序列比对算法的研究现状[J];中国科技信息;2011年09期
6 郑珩,王非,吴梧桐,杨欣,张玉彬;生物序列集成式分析平台的研制及其应用[J];生物技术通报;2002年05期
7 郭卫斌,施保昌,王能超;多重生物序列对准及其算法综述[J];高技术通讯;2001年06期
8 洪作民;杨雅君;黄镇福;刘效良;;辽东半岛南部晚先寒武纪宏体生物序列[J];国土资源;1991年03期
9 叶卓佳;稳定行星边界层相似性函数A,B,C的实验研究[J];大气科学;1982年02期
10 邵西群;巴恒星;李志鹏;章秀婷;杨福合;;生物软件在序列分析过程中的运用[J];生物信息学;2010年04期
11 魏存平,邱菀华,王新哲;一种新的模糊群体决策方法[J];系统工程理论与实践;2001年07期
12 陈有君;蒙美莲;陈炀;;分段位序比对法揭示两个序列之间关系[J];内蒙古农业大学学报(自然科学版);2010年01期
13 李小妹,王能超;生物序列比对算法的简述[J];云南民族大学学报(自然科学版);2004年01期
14 郑珂晖;宁正元;王健;;基于正则表达式的生物序列检索方法[J];莆田学院学报;2009年05期
15 刘玲;;图像检索中一种新的相似性度量方法[J];科技信息;2010年07期
16 张强 ,黄荣辉 ,田辉;荒漠戈壁下垫面表面动量和感热湍流通量参数化研究(英文)[J];Advances in Atmospheric Sciences;2003年01期
17 张强;荒漠戈壁下垫面地表湍流通量参数化的研究[J];科学技术与工程;2003年01期
18 张宇;刘雨东;计钊;;向量相似度测度方法[J];声学技术;2009年04期
19 岳平;牛生杰;胡隐樵;张强;;春季内蒙古草原地区湍流强度及其相似性函数[J];中国科学:地球科学;2010年08期
20 胡隐樵,张强;论大气边界层的局地相似性[J];大气科学;1993年01期
中国重要会议论文全文数据库 前10条
1 李永光;王镝;王国仁;马宜菲;;基于块排序索引的生物序列局部比对查询技术(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
2 邹小勇;李占潮;周漩;戴宗;;基于生物序列信息的功能预测研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
3 武作兵;;生物序列的复杂性分析——DNA序列的度规表示[A];“力学2000”学术大会论文集[C];2000年
4 岳平;牛生杰;胡隐樵;张强;;春季内蒙古草原地区湍流强度及其相似性函数[A];第七届全国优秀青年气象科技工作者学术研讨会论文集[C];2010年
5 刘维;陈崚;;基于剪枝跳跃技术的最长公共子序列算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
6 孙灿飞;沈勇;段超;;直升机振动信号处理技术的研究[A];2010航空试验测试技术学术交流会论文集[C];2010年
7 张锐;熊赟;陈越;朱扬勇;;MS-BioSM:一个基于多支持度生物序列模式挖掘算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
8 郑宝玉;;前言[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
9 叶修松;黄谟涛;欧阳永忠;李凯锋;;信号处理技术在机载激光测深中的应用[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年
10 王海江;彭静;杨玲;姚振东;谢明元;;CDIO模式下的信号处理课程群建设[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
中国重要报纸全文数据库 前10条
1 小琴;金存小博士V6-2.0[N];计算机世界;2002年
2 本报记者 刘英赫;信号处理——IT产业的基石[N];中国电子报;2000年
3 良晨;通过语音探测系统提高呼叫中心效率[N];金融时报;2000年
4 Illinois大学教授 华云生;IT将成为人类社会的重要组成部分[N];计算机世界;2000年
5 蒋皓;TI收购Alantro通信公司[N];通信产业报;2000年
6 记者施建平;赛默飞世尔科技推出新型金属探测器技术[N];中国食品报;2010年
7 ;德州仪器:持续创新 发力中国电子市场[N];中国电子报;2010年
8 ;东芝推出超薄2.5英寸60GB硬盘[N];电脑报;2002年
9 本报记者 王小庆;DSP的应用只是开始[N];中国电子报;2002年
10 刘洪;我国3G天线技术领先世界[N];中国电子报;2002年
中国博士学位论文全文数据库 前10条
1 王世元;基于信号处理技术的生物序列相似性分析与基因识别[D];重庆大学;2011年
2 杨连平;生物序列的相对特征分析及Burrows-Wheeler方法[D];大连理工大学;2011年
3 夏飞;生物序列分析算法硬件加速器关键技术研究[D];国防科学技术大学;2011年
4 黄玉娟;基于k词的DNA序列分析的模型研究及应用[D];大连理工大学;2012年
5 代琦;生物序列、结构比较中若干数学模型研究及应用[D];大连理工大学;2009年
6 杨旸;基于机器学习方法的生物序列分类研究[D];上海交通大学;2009年
7 熊赟;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
8 肖绚;基于粗粒化元胞自动机在生物序列与动力学的模型研究[D];东华大学;2006年
9 梁桂兆;生物序列表征体系构建及结构与功能关系研究[D];重庆大学;2007年
10 郭颖;生物序列的几何刻画及应用[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 郭晓冬;生物序列比较算法的研究[D];杭州电子科技大学;2012年
2 赵斐;SVM与ESOM在生物序列对比与预测中的应用研究[D];西安石油大学;2010年
3 唐南南;生物序列的图形表示及系统发生分析[D];大连理工大学;2006年
4 郭顺;生物序列模式挖掘方法研究及其应用[D];厦门大学;2009年
5 张任文;生物序列索引结构的研究与实现[D];哈尔滨工业大学;2006年
6 邱伯仁;生物序列的索引研究及其应用[D];复旦大学;2009年
7 郑元荣;生物序列及其索引的压缩存储技术的研究与实现[D];哈尔滨工业大学;2007年
8 汪挺松;曲率在生物序列相似性分析中的应用[D];大连理工大学;2007年
9 练智超;预测生物序列功能的自动方法研究[D];吉林大学;2008年
10 管维红;基于非线性理论方法的生物序列特性的研究[D];江南大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978