收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

真核生物中翻译起始位点与剪接位点的识别

刘利  
【摘要】: 本文以数理算法为基础,通过机器学习的方法来识别基因的功能位点。对序列统计分析的结果表明:尽管蛋白质的翻译起始和内含子的剪切过程有着复杂的蛋白质相互作用的参与,并且受着高级结构等诸多因素的影响,但在其中仍然存在基本的规律,这就是在一级序列中这些功能位点有着相对比较保守的特征。 首先研究了脊椎动物基因的翻译起始位点(translation initiation site,TIS)。在真核生物中,翻译并不都是起始于第一个AUG密码子,还取决于AUG前后序列的信息。有文献报道接近40%的脊椎动物都包含有上游AUG,这就使翻译起始位点的预测变得很重要。本文结合位点倾向矩阵(position propensity matrix,PPM)和开放阅读框架(open reading frame,ORF)的长度分布特征建立了一个线性分类器,此分类器能很好地把翻译起始位点和存在于5’UTR里的所谓上游AUG区分开来,同时也被用于从全长mRNA中识别出翻译起始位点。对于脊椎动物的全长mRNA序列,运用核糖体扫描模型结合我们的分类器识别其翻译起始位点得到了很高的精度,总体预测率为97.8%。在人类全长mRNA上实验也得到了令人满意的结果。 另外,为了寻找优秀的算法识别人类基因的剪接位点(splice junction site),利用离散增量和位点倾向矩阵构成的六维向量来表示序列,用支持向量机(support vector machine,SVM)在向量空间中寻找最优超平面将真实的剪接位点和虚假的剪接位点进行分类。计算结果表明,利用此算法预测人类的剪接位点有较高的预测能力。与其他的一些算法相比,表现出参数少、精度高等优点。在数据集N269中检验,对于供体位点,真实位点识别率为96.7%,虚假位点的识别率为93.4%;对于受体位点,真实位点识别率为94.3%,虚假位点的识别率为92.9%。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孙键,徐军,凌伦奖,沈如群,陈润生;用神经网络法预测mRNA的剪接位点[J];生物物理学报;1993年01期
2 郑毅,丁达夫;果蝇内含子3'剪接位点的选择机制[J];生物物理学报;1994年03期
3 刘良式;转录物剪接的分子机理[J];植物生理学通讯;1995年05期
4 夏慧煜,周晴,李衍达;隐Markov模型在剪接位点识别中的应用[J];清华大学学报(自然科学版);2002年09期
5 闻芳,卢欣,孙之荣,李衍达;基于支持向量机(SVM)的剪接位点识别[J];生物物理学报;1999年04期
6 雷静,阮晓钢;DNA序列与剪接位点的关联性分析[J];北京工业大学学报;2004年03期
7 李骜,冯焕清,王涛,王明会;基因位点预测的一种特征选择优化算法[J];北京生物医学工程;2005年02期
8 李骜,王涛,冯焕清,王明会;基于贝叶斯网络的DNA序列剪接位点预测[J];生物物理学报;2003年04期
9 孙应飞,樊晓丹,李衍达;真核基因剪接位点二级结构特征[J];清华大学学报(自然科学版);2003年03期
10 张鹏飞;李前忠;左永春;李涛;;基于位置关联权重矩阵及DNA结构信息预测人类剪接位点[J];内蒙古大学学报(自然科学版);2010年04期
11 杨王黎;许少华;;利用条件随机场实现DNA剪接位点的预测[J];重庆大学学报;2010年10期
12 周艳红;王卉;杨雷;;基于特征挖掘与融合的剪接位点识别[J];华中科技大学学报(自然科学版);2006年12期
13 卢杰;张珈敏;林美娟;曹旭;胡远扬;;RNA病毒翻译调控元件——内部核糖体进入位点(IRES)[J];中国生物化学与分子生物学报;2007年07期
14 胡钢清;刘永初;郑晓斌;杨一帆;佘振苏;朱怀球;;原核基因翻译起始位点预测的新方法(英文)[J];生物化学与生物物理进展;2008年11期
15 张利绒;罗辽复;;人类基因组中的盒式外显子和组成性外显子比较及剪接位点预测[J];生物物理学报;2009年S1期
16 张静,刘次全;真核生物mRNA二级结构与内含子剪接[J];生物化学与生物物理进展;1999年04期
17 张梅;隐Markov模型的基本原理及其在基因识别中的应用[J];陕西科技大学学报;2003年04期
18 章国卫,宋怀东,陈竺;mRNA选择性剪接的分子机制[J];遗传学报;2004年01期
19 杨艳;;人工神经网络和支持向量机在剪接位点识别上的应用[J];科技资讯;2007年22期
20 张翼;;RNA在RNA剪接中的功能:从催化到调控[J];生命科学;2008年02期
中国重要会议论文全文数据库 前10条
1 金冲飞;王玮;姚克;;剪接位点突变通过激活下游隐性剪接位点而导致先天性白内障的发生[A];2008年浙江省眼科学术会议论文集[C];2008年
2 雷静;阮晓钢;;基因序列与基因剪接的关联性分析[A];第二十二届中国控制会议论文集(下)[C];2003年
3 富显果;张朵;张晓;柯龙凤;严爱贞;朱忠勇;兰风华;;脆性X智力障碍1基因新型可变剪接外显子和剪接异构体的鉴定[A];第八次全国医学遗传学学术会议(中华医学会2009年医学遗传学年会)论文摘要汇编[C];2009年
4 高世博;张运陶;;基于AdaBoost算法的拟南芥翻译起始位点识别[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
5 邓婷;童绎;彭淑玲;董冰;李杨;;国人—常染色体显性视神经萎缩家系OPA1基因的新突变[A];中华医学会第十二届全国眼科学术大会论文汇编[C];2007年
6 张利绒;罗辽复;;人类基因组中的盒式外显子和组成性外显子比较及剪接位点预测[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
7 范丙友;高水平;刘改秀;史国安;侯小改;李嘉珏;;牡丹ACC氧化酶基因组DNA序列的克隆及序列分析[A];中国观赏园艺研究进展(2010)[C];2010年
8 周建平;杨足君;冯娟;迟世华;刘成;任正隆;;小麦蛋白翻译起始因子5A基因(eIF5A)的克隆与分析[A];中国细胞生物学学会2005年学术大会、青年学术研讨会论文摘要集[C];2005年
9 张宏;盛剑秋;李爱琴;张渊智;韩英;李世荣;;hMLH3基因种系突变与中国人群HNPCC相关性的研究[A];中华医学会第七次全国消化病学术会议论文汇编(下册)[C];2007年
10 ;Proteins or Peptides Ligation--in givo and in Vitro,and Between two Molecular or More[A];2008年全国生物化学与分子生物学学术大会论文摘要[C];2008年
中国博士学位论文全文数据库 前10条
1 夏慧煜;选择性剪接识别相关问题研究[D];清华大学;2006年
2 蒋劲;先天性蜗牛壳样白内障疾病相关候选基因的定位和克隆[D];浙江大学;2008年
3 彭司华;计算智能在生物信息学中的应用研究[D];浙江大学;2004年
4 原玉香;白菜类作物抽薹开花的分子遗传分析[D];中国农业科学院;2008年
5 杨乌日吐;基于序列信息预测选择性剪接位点和盒式外显子[D];内蒙古大学;2008年
6 刘薇;选择性剪接顺式调控元件的位置效应[D];武汉大学;2010年
7 赵丽娜;多维液相色谱质谱组合分析在志贺菌蛋白组基因组学中的应用[D];北京协和医学院;2010年
8 张亚妮;Zhangfei基因在细胞内质网应激反应中的生物功能研究[D];西北农林科技大学;2010年
9 李稚锋;真核基因剪接机制相关特征研究[D];国防科学技术大学;2006年
10 杨靖轩;人Na/K-ATPase α1亚基内含子及盐敏感高血压家系心钠素基因5'FS区结构与功能关系的研究[D];中国协和医科大学;2000年
中国硕士学位论文全文数据库 前10条
1 刘利;真核生物中翻译起始位点与剪接位点的识别[D];内蒙古大学;2007年
2 吕俊杰;真核基因剪接位点识别算法研究[D];哈尔滨工程大学;2010年
3 曹锦;条件随机场在基因剪接位点预测中的应用研究[D];福建农林大学;2012年
4 李燕青;基于支持向量机方法的剪接位点预测[D];福建农林大学;2012年
5 闫晓强;RNA剪接识别研究[D];吉林大学;2009年
6 黄倩;脊椎动物基因组的超级保守序列及剪接位点分析[D];天津大学;2008年
7 冯兆勇;原核生物基因翻译起始位点的识别[D];河北工业大学;2007年
8 薛依铭;基于机器学习方法的基因剪接位点识别研究[D];江南大学;2007年
9 马闯;基因结构预测软件的测评及翻译起始位点预测[D];华中科技大学;2007年
10 高娜;植物致病菌基因组重新注释及数据库构建[D];山东理工大学;2009年
中国重要报纸全文数据库 前3条
1 本报记者 张洪;用计算机“淘洗”海量生物信息[N];大众科技报;2002年
2 北京世纪坛医院肿瘤研究室 王涛;前列腺癌与早老性痴呆有相同特异蛋白[N];健康报;2009年
3 ;从α5(Ⅳ)链mRNA突变分析看Alport综合征基因型和表型关系[N];中国医药报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978