收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于纠错编码理论的DNA序列编码特性分析

刘晓  
【摘要】: 现代生物学的研究不再是单一学科的研究,而是多学科交叉、综合的研究。由于生物系统自身的复杂性,需要将多种分析理论和研究方法应用到该领域。随着基因工程所获得的基因数据的急速增加,引起了人们采用新方法、技术和工具对其进行分析的兴趣。由于生物系统中存在的信息传递、编码与现代通信系统中的信息传输与编码的相似性,因此将现代通信工程中的纠错编码理论应用于生物遗传序列的研究和测试系统的设计并取得了一些可喜的进展。 本文基于通信工程的纠错编码理论对生物系统信息分析方法进行研究,对若干对象的序列进行分析,旨在为通信纠错编码理论在生物学领域研究中的应用寻求新的途径和方法。 开展工作如下: 1、根据三联体密码在遗传信息表达过程中的重要作用,将三联体密码(而不是单个碱基)作为遗传信息的基本信息单元,同时考虑相邻密码子之间的相互作用,借鉴通信编码理论中分组码编码模型的设计、分析方法,通过试验选定基于分组码的(6,3)分组码模型。选定GC含量不同的12种原核生物和9种真核生物作为分析对象,利用(6,3)分组码模型对它们的DNA序列进行分析,利用码距作为特征参数与分析对象的生物特征进行对比。分析结果在表明原核与真核分析对象的平均码距在起始密码子附近和终止密码子附近均呈现出显著变化,在原核生物的SD区域也有显著变化。 2、在纠错编码中,卷积码是一种具有较好性能的信道编码方式,理论和实际上均已证明卷积码的性能至少不比分组码差,应该可以寻找更好的卷积编码模型来分析DNA序列的编码特性。参考分组码模型分析方法和结果,借鉴通信编码理论中卷积码编码模型的设计、分析方法,基于密码子简并性、密码子上下文关联性、碱基短程关联占优特性,使用三联体密码作为基本信息单元,设计了(6,3,1)卷积码分析模型。利用(6,3,1)卷积码模型对所选12种原核生物和9种真核生物DNA序列进行分析,结果表明原核与真核分析对象的平均码距在起始密码子附近和终止密码子附近均呈现出显著变化,在原核生物的SD区域有显著变化。此外,所有对象的平均码距曲线在编码区表现出明显的周期3特性。根据观察到的不同GC含量的分析对象平均码距曲线分离的特性(特别是对于原核生物),我们在实验中新定义了一个参数:特征平均码距(CACD),它与GC含量具有关联,与原核生物GC含量具有较好的比例特性。这赋予了编码参数以生物特征,表明卷积码模型在生物信息研究中具有深入研究和应用的潜力。 由于上述分析模型的设计是基于生物遗传信息的通用特性提出,因此对分析对象没有依赖性,可以对多类对象进行分析而不需要对模型调整。 3、侧重于基于卷积码的分析模型,根据碱基短程关联占优特性,对参数进行了对比分析。考虑通常分析方法中常采用将单个碱基作为基本信息单元,选定(2,1,1)卷积码模型进行分析。考虑过渡状态的对比,选定(3,2,1)卷积码模型进行分析。通过对编码输出长度、码距计算码长等参数的对比分析,初步确定效果较好的(6,3,1)、(3,2,1)和(2,1,1)模型作为分析模型。 4、将基于纠错编码的分析模型应用于序列相似性分析。使用所设计的(6,3,1)、(3,2,1)和(2,1,1)卷积码模型对11个物种(包括人,山羊,负鼠,鸡,狐猴,小鼠,大鼠,兔子,牛,大猩猩和黑猩猩)的β-球蛋白第一个外显子编码序列的相似性/不相似性进行分析。利用L/L和M/M矩阵的归一化最大特征值构建8分量矢量,计算其两两端点间的欧几里得距离,分析结果反映出3种灵长类对象(人,黑猩猩,大猩猩)之间由于进化关系而存在的强相似性,而与负鼠(距现存哺乳动物最远物种)和鸡(其中唯一非哺乳动物对象)的相似性很弱。数据分析的结果表明所提出的方法可以反映所分析的DNA序列的重要信息。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王菲;罗恩杰;;CRISPR及其在原核生物防御系统中的作用[J];热带医学杂志;2008年10期
2 邢其华;;最古老的生物[J];生命世界;1981年02期
3 赵小平;生物的遗传重组[J];阴山学刊;1995年S2期
4 柯为;原核生物的DNA复制国际会议[J];中国生物工程杂志;1982年02期
5 时光;何旋;徐定冼;郭小丽;高正平;王惠弟;孙訚訚;;每期20题[J];生物学通报;1993年05期
6 阎章才;A因子在原核生物分化和次级代谢中的分子调控[J];微生物学报;2000年01期
7 关耳;;沸水微生物之中有祖先?[J];海洋世界;2003年08期
8 王晓云;;数字背后的隐忧[J];水利天地;2010年08期
9 ;《自然》:美提出生命进化新假说:两个原核生物造一个新生命[J];现代生物医学进展;2009年15期
10 刘燕明;;原核细胞型生物的现代分类[J];生物学通报;1993年11期
11 ;共生[J];生物进化;2009年03期
12 焦念志,王荣,李超伦,吉鹏;海洋初级生产过程中原核生物和真核生物的作用[J];海洋与湖沼;1994年06期
13 谭华荣;Sigma因子和抗-Sigma因子在原核生物分化中的分子调控[J];微生物学报;1997年03期
14 许志刚;植物病原原核生物的分类现状[J];植物病理学报;1998年02期
15 卢永忠;;蓝藻钙信号的研究进展(英文)[J];Marine Science Bulletin;2010年02期
16 耿雪侠;原核生物和真核生物DNA复制的共同点[J];生物学教学;2000年01期
17 鹿红;浅析原核生物的两个问题[J];生物学通报;2003年02期
18 孙丕喜;陈颖稚;王宗兴;陈皓文;;原核生物概况及海洋原核生物组成[J];广西科学院学报;2010年02期
19 刘冰花;;黏细菌生物活性物质的研究[J];成都大学学报(自然科学版);2011年02期
20 吴名文;;原核生物与真核生物[J];生物学通报;1981年06期
中国重要会议论文全文数据库 前10条
1 方呈祥;彭方;张珞珍;辛晓红;;遗传信息对原核生物物种界定的关键作用[A];基因开启未来:新时代的遗传学与科技进步——湖北省遗传学会第八次代表大会暨学术讨论会论文摘要汇编[C];2009年
2 禹胄;李涛;赵进东;罗静初;;原核生物基因组序列装配辅助系统[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
3 余振苏;朱怀球;;原核生物基因系统的统计模型及其应用[A];北京力学会第11届学术年会论文摘要集[C];2005年
4 叶姜瑜;王希;;原核生物透明质酸合酶(Hyaluronan Synthase)探询[A];重庆市遗传学会第一届学术年会暨纪念孟德尔规律再发现100周年学术讨论会论文集[C];2000年
5 李星学;;陆生植物的起源与裸蕨植物(摘要)[A];中国古生物学会山旺现场会议暨第二届第八次扩大理事会论文集[C];1978年
6 许志刚;;植物病原原核生物的分类现状[A];江苏省植物病理学会第九届会员代表大会暨学术研讨会论文集[C];1999年
7 王君;樊荣;朱小锐;;对SiRNA的全新认识和应用[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(下册)[C];2002年
8 张文;方伟武;唐焕文;蔡旭;;基于信息离散性度量方法的微生物全蛋白质组的系统发育分析[A];中国运筹学会第七届学术交流会论文集(中卷)[C];2004年
9 李越中;;高等原核生物-粘细菌及其细胞行为的进化与多样性[A];第二届中国青年学者微生物遗传学学术研讨会论文集[C];2006年
10 刘永初;朱怀球;;一种基于翻译调控信号的原核生物基因组比较方法[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
中国博士学位论文全文数据库 前10条
1 陈一然;潮间带多细胞趋磁原核生物的显微分离、鉴定及系统进化研究[D];中国科学院研究生院(海洋研究所);2014年
2 马勤;原核生物中调节子的研究和预测[D];山东大学;2010年
3 廖晓兰;几种植物病原原核生物实时荧光PCR检测方法的研究[D];湖南农业大学;2003年
4 刘丙强;原核生物中的转录调控模体预测研究[D];山东大学;2010年
5 李凤敏;核蛋白的亚核定位和植物、非植物及小鼠蛋白质的亚细胞定位预测研究[D];内蒙古大学;2007年
6 郭文久;微卫星在基因组上的分布与功能及其计算方法初步研究[D];四川农业大学;2004年
7 周立前;基因识别算法研究与基因组进化分析[D];湘潭大学;2008年
8 雷呈祥;与自身免疫性溶血性贫血相关基因的克隆及在原核生物中的表达[D];复旦大学;2003年
9 蒋志华;硒代半胱氨酸通读效率的研究及含硒GST在大肠杆菌中的表达[D];吉林大学;2005年
10 欧竑宇;原核生物基因识别算法研究和基因组进化分析[D];天津大学;2004年
中国硕士学位论文全文数据库 前10条
1 韦芳萍;原核生物中重复序列的分析及数据库的构建[D];广西大学;2002年
2 胡元森;海藻糖-6-磷酸合成酶基因在原核生物中的表达及其功能研究[D];河南农业大学;2002年
3 龚勋;粘细菌mRNA差异表达法研究及耐盐粘球菌HW-1的mRNA差异表达分析[D];山东大学;2005年
4 卫海滨;组份距离方法构建基于两组蛋白质的原核生物亲缘树[D];浙江大学;2004年
5 刘晓磊;原核生物基因组复制起始点的识别与结构分析[D];河北工业大学;2007年
6 初春;基于信息论的原核生物翻译初始阶段的编码特性研究[D];重庆大学;2008年
7 杨益芬;四川大英盐湖原核生物多样性初步研究[D];四川农业大学;2009年
8 任晓凯;基于序列特征的非编码RNA基因预测[D];吉林大学;2008年
9 章芬;原核生物基因组寡核苷酸转移概率偏倚的物种特异性及致病关联性[D];华南理工大学;2012年
10 林中宝;水稻OsbolA1基因克隆与表达研究[D];华中农业大学;2007年
中国重要报纸全文数据库 前10条
1 本报记者 冯卫东;两个原核生物造一个新生命[N];科技日报;2009年
2 刘霞;海底动物稀少之谜获解[N];科技日报;2008年
3 新华社;日专家发现“中间型”微生物[N];光明日报;2006年
4 泓天威技术服务部;加利健[N];中国畜牧水产报;2001年
5 ;蜜蜂螺原体病的防治[N];中国畜牧兽医报;2006年
6 郑新城;养殖贝类大规模死亡原因及防治措施[N];中国渔业报;2007年
7 李济 供稿;理科综合能力测试模拟(三)[N];山西科技报;2003年
8 汪品先;我国地球系统科学向何处去[N];文汇报;2006年
9 本报记者 华凌;科学不应成为个人赚钱的工具[N];科技日报;2009年
10 本报首席记者 任荃;也许时间将为人造生命洗去忧虑[N];文汇报;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978