收藏本站
《大连理工大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

生物序列、结构比较中若干数学模型研究及应用

代琦  
【摘要】: 近年来,得益于基因组测序技术的进步和物质结构解析技术的发展,使有关生物序列和结构的数据与日俱增.面对海量的数据,如何对其进行科学的分析、处理和保存给计算机科学、数学等学科提出严峻的挑战,同时也吸引大量的数理科学工作者转向生命科学的研究领域,使得计算分子生物学应运而生.计算分子生物学的研究内容十分丰富,例如,序列比较、基因识别、分子进化、比较基因组学、RNA和蛋白质结构预测等等,其中大多数研究工作是以序列、结构的比较为基础,因此,生物序列、结构的比较不仅是计算分子生物学中最基本、最重要的课题之一,而且对生命科学的研究具有深远的影响.本文以该领域中的若干数学模型为研究对象,主要成果有: 1、在第二章,提出了DNA序列的W-几何表示模型,并设计一种算法,用来寻找特定碱基含量丰富的片断;以相邻碱基对为对象,利用单元和系统的概念,设计了DNA序列的PNN-几何表示模型,并提取了一种简单有效的数值刻画量;指出了几何表示模型中的距离矩阵在刻画曲线时存在退化现象,并利用曲率矩阵克服了距离矩阵的缺陷. 2、在第三章,构建了生物序列、结构的马尔可夫模型,比较了k步转移概率在刻画生物序列中的差异,并将模型拓展应用到结构比较、结构相似性搜索、进化分析等领域;利用加权相对熵构建了字统计模型和马尔可夫模型的混合模型,利用有效的评价性方法和大量实验表明混合模型提高了模型抽取信息的能力. 3、在第四章,根据序列、结构中元素的分布存在随机性,定义随机分布函数,并引入回归分析模型来寻找分布函数之间的依存关系,进而发现序列、结构中元素的整体变化规律.另外,利用不同结构对应回归模型间的差异获得不同结构的相似程度,从而降低了结构比较的复杂度. 4、在第五章,利用氨基酸打分矩阵,提出了“蛋白质空间”的定义以及“蛋白质空间”的字统计模型,并设计了字的编辑距离用来比较不同蛋白序列.通过系统的比较分析,对如何构建有效的“蛋白质空间”,如何选择合适的度量等问题提出了合理的建议.
【学位授予单位】:大连理工大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:O242.1

手机知网App
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026