收藏本站
《西北师范大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

生物高分子中信息学分析新方法研究

刘宏德  
【摘要】: 一、研究背景及意义 随着人类基因组计划(Human genome Project(HGP))的完成,关于生命科学的研究进入了后基因时代,迄今,已经产生了海量的数据,数据的积累必将产生重大的发现。如何从这些数据中最大限度地获取有用信息并缩短整个研究的进程是科学家面临的重要课题,随之兴起的与DNA有关的复杂体系的信息学要求研究者能够利用信息学的手段获取、分析和挖掘数据结果,尽管已有相当多的重大发现,但是距离最终解析所有的关于生命的奥秘仍有很长的路程,需要研究者开拓新的思路、发现新的分析方法和工具。 本文主要针对生物高分子体系(DNA和蛋白质等),运用生物信息学和化学计量学(主成分分析、人工神经网络、多元统计方法、傅立叶分析、小波分析)的方法,做了以下研究:1,基因预测新方法研究;2,目标分子与DNA的相互作用研究;3,复杂生物、化学体系频率分析新方法研究,其中包括:(1)复杂分析化学体系重叠信号的解析研究;(2)基于小波变换的核酸序列的频率特征和进化研究;(3)膜蛋白跨膜区域的预测研究;4,隐马尔可夫模型对核酸序列的识别研究。 二、研究内容及结果 1.基因预测新方法研究 提出了一种综合的基因预测方法,首先计算序列的四个的特征:三周期特性、D值、GC含量和New Z_Curve;利用这四个特征图谱,初步确定编码区的数目和位置;然后用序列搜索的方法准确确定基因的结构。其中New Z_Curve特征是基于Z_Curve提出的一种新的特征,通过该特征,可以初步确定编码区的数目和位置。对5个已知的基因的预测结果显示,本文提出的方法具有可行性。 2.目标分子与DNA的相互作用研究 目标分子与DNA相互作用的研究在了解药物作用机理、分子设计和药物筛选等方面有重要意义。目前主要以实验方法研究两者的作用机理(包括作用常数和作用模式),较难从分子结构水平发现影响相互作用的因素,而且对于批量的未知化合物与DNA的相互作用无法进行预测。 本文以目标分子与DNA相互作用的实验数据和目标分子的结构量化数据为基础,应用模式识别技术、多元回归和人工神经网络方法讨论了显著影响相互作用的因素,建立了两个预测作用常数的模型和一个预测作用模式的模型。初次量化的分子结构参数有24种,经过筛选发现其中的12种对相互作用有显著的影响。所建立的模型对作用模式和常数的预测有较好的准确性。这些研究为抗癌药物的分子设计和筛选可提供有价值的信息。 3.复杂生物、化学体系频率分析新方法研究 (1)复杂分析化学体系重叠信号的解析研究 为了估计重叠信号中单峰(组分)的数目和位置,本文基于连续小波变换((CWT))提出了一种新的重叠峰定位方法——连续小波变换极大值谱(maximum spectrum of continuous wavelet transform(MSCWT)),在blSCWT中,峰的位置和数目与原信号包含的单峰的位置和数目一致。在该方法中,CWT的计算是在一定的尺度范围内进行的(不同于单尺度变换)。为了获得合适的变换尺度范围,提出了一个新的判据,如果Cdilation代表中心尺度,则合适的范围是[Cdilation-6±2,Cdilation+1±1]。通过MSCWT检测到峰的位置和数目后,拟合方法被用于还原各单峰信号。本文对模拟信号、高效液相色谱(HPLC)、紫外信号(UV)、差示脉冲伏安(DPV)信号分别做了分析,结果表明本文的重叠信号解析技术有很高的准确度,适合处理不同类型的重叠信号。 (2)基于小波变换的核酸序列的频率特征和进化研究 提出了两种新的频率分析技术——小波频率谱(WFS)和小波变换Fourier频率谱(WTFS),并将其成功地应用于核酸序列的频率分析之中。结果表明:WFS和WTFS能准确地检测核酸编码区序列的三周期性,即在0.333Hz处有信号峰。与Fourier频率谱相比,WFS没有噪音干扰,而且可以自由变换区间观察信号频率;而WTFS除了具有WFS的优点外,其谱图呈线状,非常有利于频率的分析。利用WFS和WTFS,再结合基因的其它特征,有望开发具有自识别的基因发现工具。 WFS除了可以研究核酸序列的频率特点以外,还可以作为序列的频域表示。基于WFS表示,本文对11个核酸序列(引起急性严重呼吸系统窘迫症的冠状病毒(SARS_CoV))做了进化分析,结果表明尽管它们非常相似,但是还是存在差异,暗示它们具有不同的变异方式。这种基于序列频域表示的进化分析是一种新的分析思路。 (3)膜蛋白跨膜区域的预测研究 如何从少数已知结构的膜蛋白预测大量未知结构的膜蛋白是蛋白质结构预测的主要内容之一。本文利用MSCWT对8种SARS_COV膜蛋白的跨膜区域做了预测,其结果与TMpred(Swiss)软件、单尺度连续小波变换的结果进行了比较,发现本文所述的方法有较高的准确性。而且可以为进一步研究跨膜片段的折叠提供参考。 4.隐马尔可夫模型(HMM)对核酸序列的识别研究 建立了一个用于识别DNA(或RNA)序列中多个特殊序列的隐马尔可夫模型,该模型通过训练可以识别任一序列中是否存在与训练序列相似的序列。文中以预测连续出现的CG丰富区和TA丰富区为例,提出了一种可操作的识别过程。实验结果显示该HMM可以成功识别序列中是否含有期待的序列。通过设定具有不同特征的训练序列,模型可推广用于任何特征序列的识别。 三、创新点 本论文的创新点如下: (1)基于Z_Curve曲线,衍生出了核酸序列的一种新的特征曲线——NewZ_Curve(NZC),依据该曲线中出现的单峰或靠得很近的组峰的数目和位置可以预测编码区的数目和大概位置,这在文献中未见报道。另一个创新点是本文提出了一种综合多特征的基因识别方法,对已知的基因预测的结果显示,该方法具有较好的准确性,而且操作简单。 (2)在目标分子与DNA相互作用的研究中,提出了从目标分子结构量化参数出发,结合实验数据预测目标分子与DNA相互作用的模式和常数的新方法,该方法提出的两个预测作用常数和预测作用模式的模型能对批量未知分子与DNA的作用情况进行预测,这对分子设计和筛选具有重要意义。 (3)在处理复杂化学体系重叠信号的研究中,提出了一种基于连续小波变换的新的波谱方法——连续小波变换极大值谱(MSCWT),该谱能准确定位重叠信号中各单组分峰的数目和位置,为进一步用拟合方法解析原始重叠信号提供了坚实的依据。 (4)基于连续小波变换,提出了一种新的频率分析波谱——小波频率谱,并将其应用于核酸序列(以SARS_CoV为例)的频率分析和核酸序列的频域表示。利用核酸序列的频域表示研究了11种SARS_CoV的系统进化,这种基于序列频域表示的进化研究思路在其它文献中未见报道。 (5)开发了小波变换Fourier频率谱(WTFS),并将其应用于蛋白质编码区三周期性的检测。WTFS继承了小波变换的多尺度分析(可以自由变换频率范围)和Fourier变换的高分辨的特点,其谱图呈线状,易于观察,抗噪能力强。 (6)用连续小波变换极大值谱处理膜蛋白的疏水序列,不但可以较好地确定跨膜区域的位置,而且可以推测跨膜区域内蛋白的可能的折叠方式。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 全玉生,高文胜,严璋;小波变换在局部放电测量中的应用研究[J];电网技术;1998年07期
2 全玉生,高文胜,严璋;应用小波变换提高局部放电测试灵敏度[J];高电压技术;1998年01期
3 杨毓英,史习智,韦蕾;小波变换用于豚鼠脑干听觉诱发电位信号的特征提取[J];中国生物医学工程学报;1998年03期
4 徐卫明;利用小波变换降低环境噪声对测深数据的影响[J];东北测绘;1998年02期
5 谢利;;小波变换及小波能量谱在多尺度分析中的应用[J];中山大学研究生学刊(自然科学版);1998年S1期
6 ;光学变换及频谱分析[J];中国光学与应用光学文摘;1998年01期
7 杨基海,刘玫,李江安,连加锐,周平;基于小波变换的心室晚电位检测[J];中国科学技术大学学报;1999年01期
8 简晓明,李明轩;小波变换和自适应噪声抵消在闭合裂纹超声检测中的应用[J];声学学报(中文版);2000年02期
9 刘照升,宋作忠;小波分析在超声测试信号分析中的应用[J];哈尔滨师范大学自然科学学报;2000年04期
10 刘志;DNA序列的一种分类方法[J];陕西师范大学学报(自然科学版);2002年S1期
11 邵晨曦;卢继军;周颢;;癫痫EEG波形的小波分析方法[J];科学技术与工程;2002年03期
12 李文敬;小波变换在图像压缩中的应用[J];广西师范学院学报(自然科学版);2003年02期
13 郑凯梅,余生晨;心电信号的小波变换滤波算法的改进[J];山东生物医学工程;2003年01期
14 唐和生,薛松涛,陈镕,王远功;基于小波变换在线结构损伤检测分析研究[J];固体力学学报;2004年01期
15 杜红,苑延华;高维小波变换的一般形式[J];黑龙江科技学院学报;2004年01期
16 林卉,杜培军,张莲蓬;一种基于小波变换的新的边缘检测方法[J];测绘工程;2005年02期
17 严骏,王建新,周朝霞,杨敏;小波消噪和AR谱技术在汽车传动轴故障诊断中的应用[J];解放军理工大学学报(自然科学版);2005年03期
18 杨群,洪春勇,刘海英;基于灰度图像的边缘检测方法[J];科技广场;2005年05期
19 朱艳鑫,王蜀娟,宋国乡,颜毅华;太阳微波爆发中尖峰辐射的带宽计算[J];中国科学院研究生院学报;2005年05期
20 黄昕;张良培;李平湘;;基于小波的高分辨率遥感影像纹理分类方法研究[J];武汉大学学报(信息科学版);2006年01期
中国重要会议论文全文数据库 前10条
1 黄力宇;林富国;王伟荣;;心电数据小波压缩新方法研究[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
2 王秀碧;黄晓莉;刘永春;;基于小波变换的多尺度边缘检测[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
3 王刚;黄泰翼;;基于小波变换和规则的汉语声调识别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
4 鲍文;刘金福;祝豪;;基于小波变换的电厂实时数据压缩存储系统[A];2004电站自动化信息化学术技术交流会议论文集[C];2004年
5 王光芦;徐明;;基于小波分析炮击振动信号的降噪处理[A];首届全国航空航天领域中的力学问题学术研讨会论文集(下册)[C];2004年
6 王小侠;赵凤群;戴芳;方小艳;;基于分形维数的四叉树图像编码[A];2006“数学技术应用科学”[C];2006年
7 吴昊;曾国卿;;一种基于Haar小波的图像处理技术[A];2006“数学技术应用科学”[C];2006年
8 石星;;小波变换在雷达信号处理中的应用[A];四川省电子学会雷达与火控、电子线路与系统专业委员会学术交流会10周年优秀论文集[C];2006年
9 刘双喜;邢济收;魏建亮;;小波变换在齿轮边缘检测中的应用[A];全国第二届嵌入式技术联合学术会议论文集[C];2007年
10 尹强;;一种基于粒子群算法的半脆弱水印方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
中国重要报纸全文数据库 前10条
1 奇 云;基因预测健康:双刃剑考验人类道德[N];大众科技报;2005年
2 何德功;日专家通过基因预测肺癌手术后存活率[N];中国中医药报;2003年
3 吴玉田殷学平;中药质量控制又添新武器——小波变换近红外光谱分析系统[N];中国医药报;2004年
4 记者 胡菊芹;要从哲学高度把握创新方法研究[N];科技日报;2007年
5 鲁文;意可曼完全可降解生物材料项目投产[N];中国包装报;2008年
6 广西 陈华杰;EVD,一路走好[N];电子报;2002年
7 王平;移动式大气激光通信信号接收新方法研究 获2006年国家自然科学基金研究计划项目—青年科学基金项目[N];科技日报;2007年
8 本报通讯员 孙吉来 邵明奎 张建军;春意盎然“意可曼”[N];济宁日报;2010年
9 北京航空航天大学计算机系 李炜;探寻视频编码技术发展的足迹[N];中国计算机报;2000年
10 ;中国石油天然气集团公司高级技术专家简介(四)[N];中国石油报;2005年
中国博士学位论文全文数据库 前10条
1 刘宏德;生物高分子中信息学分析新方法研究[D];西北师范大学;2006年
2 李少梅;数字地貌晕渲理论与技术的研究[D];解放军信息工程大学;2004年
3 王强;基于声信号检测的管道TPD预警系统研究[D];浙江大学;2005年
4 姜朝阳;作物冠层传输过程中的时间序列分析与阻力估算[D];中国科学院研究生院(上海生命科学研究院);2003年
5 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
6 柯丽;基于小波变换的空间遥感图像实时压缩方法研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2005年
7 董卫军;基于小波变换的图像处理技术研究[D];西北大学;2006年
8 姜长泓;轨道车辆轮轴故障检测系统研究[D];吉林大学;2006年
9 李丽明;瞬态诱发耳声发射(TEOAE)识别与分析新方法的应用基础研究[D];中国协和医科大学;1997年
10 修吉宏;基于图像功率谱的航空图像质量判别技术研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2005年
中国硕士学位论文全文数据库 前10条
1 钟艳华;JPEG2000中DWT的VLSI结构设计[D];国防科学技术大学;2010年
2 海洋;基于不可分小波变换的指纹增强[D];华中科技大学;2010年
3 杨旭;基于小波变换的综合滤波法去噪声[D];昆明理工大学;2010年
4 廖重贵;小波分析在变形监测中的应用研究[D];江西理工大学;2010年
5 钟读贤;小波矩量法在电磁散射问题求解中的应用研究[D];安徽大学;2010年
6 丁西明;基于小波变换的图像增强研究[D];安徽大学;2010年
7 蔡娜;小波变换在THz时域光谱技术中的应用[D];河北工程大学;2010年
8 姚付良;基于小波变换的数字水印技术研究[D];解放军信息工程大学;2008年
9 李娜;基于小波变换和自适应算法的声学回声消除理论与应用研究[D];昆明理工大学;2010年
10 刘美丽;基于小波变换的图像去噪方法的研究[D];长春工业大学;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978