收藏本站
《南昌大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

基于支持向量机的蛋白质功能预测新方法研究

施绍萍  
【摘要】:随着人类进入后基因组时代,基因功能的注释已成为科学研究的焦点问题。依据中心法则,记录遗传信息的基因必须翻译成蛋白质才能执行其功能,因而蛋白质功能的研究变得至关重要。虽然可以通过实验方法确定蛋白质的功能,但是实验方法费时、费力且费用昂贵,无法满足在全基因组范围内对蛋白质功能进行注释的需要。因此,发展可靠、经济和高通量的蛋白质功能预测方法成为一项迫切任务。本文根据蛋白质功能预测的研究现状,基于机器学习方法支持向量机,从氨基酸序列出发,设计了一系列蛋白质序列的特征表达新编码方法,对蛋白质的功能进行预测研究,主要工作概括如下: 1.建立了线粒体和叶绿体亚结构预测的新方法。从氨基酸的极性和疏水性出发,基于离散小波变换特征提取方法,提出了一种新的伪氨基酸成分特征编码方法,成功应用于线粒体和叶绿体蛋白质的区分。在此基础上进一步预测了线粒体和叶绿体亚结构,各类亚结构的预测准确率比现有方法提高了3.7%~22.1%,尤其是线粒体外膜和叶绿体内囊体腔的预测结果有极大改进。这些结果表明离散小波变换不仅可以消除氨基酸序列中的噪声成分干扰,而且可以有效地提取整条蛋白序列的次序信息。此外,对线粒体和叶绿体两种蛋白质物理化学性质进行了讨论,发现线粒体蛋白质中极性特征更明显,而叶绿体蛋白质中疏水特征更显著。 2.构建了蛋白质精氨酸和赖氨酸甲基化修饰位点预测模型PMeS。提出了一种新的位置权重氨基酸成分去反映修饰位点附近残基的位置信息,并将其与氨基酸属性编码和溶剂可及表面面积融合去捕获甲基化位点的特征信息。10-倍交叉验证结果显示,PMeS的特征编码方法对甲基化状态的识别十分有效。同时,对特征的选择、窗口长度、正负样本比例和模型的稳定性进行了深入探讨。不同交叉验证和独立测试的结果表明,PMeS模型稳定可靠且明显优于其它预测工具。基于PMeS模型,我们构建了精氨酸和赖氨酸甲基化修饰位点的在线预测服务网站(http://bioinfo.ncu.edu.cn/inquiries_PMeS.aspx)。 3.建立了同时预测完整蛋白上赖氨酸残基的甲基化和乙酰化修饰位点的新方法PLMLA。该方法通过属性分组重量编码、位置权重氨基酸成分和二级结构分别提取修饰位点附近的物理化学属性、序列信息和结构特征。对甲基赖氨酸、乙酰赖氨酸和非甲基化与非乙酰化赖氨酸在残基的位置特异属性、物理化学性质和二级结构方面的特征差异进行了详细分析。基于不同训练特征的预测结果揭示,具有多特征融合的预测模型能充分利用不同特征之间的互补信息去改进模型的预测性能。基于独立测试与其它方法进行了比较,PLMLA对甲基赖氨酸的预测准确率比BPB-PPMS和MASA的分别高30.3%和37.88%;对乙酰赖氨酸的预测准确率比LysAcet和N-Ace的相应结果分别高33.33%和36.11%。这充分表明PLMLA方法极大地改进了甲基赖氨酸和乙酰赖氨酸的预测研究现状,是识别赖氨酸残基甲基化和乙酰化修饰的有效工具。最后,我们构建了基于氨基酸序列即可对完整蛋白质序列上赖氨酸的甲基化和乙酰化修饰位点同时进行预测分析的在线服务平台(http://bioinfo.ncu.edu.cn/inquiries_PLMLA.aspx)。 4.开发了酪氨酸硝基化位点预测的新方法。采用氨基酸残基信息熵和二肽关联熵优化窗口,结合氨基酸的物理化学性质和结构特征构建了蛋白质酪氨酸硝基化位点的预测模型。对信息熵优化窗口和传统连续窗口进行了初步探讨,结果显示信息熵窗口能够有效捕获酪氨酸硝基化肽段上的重要位点,克服短肽序列易丢失信息而单纯增大肽段长度又会引入冗余信息的矛盾,并有效提高模型的预测性能。特征分析揭示酪氨酸残基的局部静电环境、邻近的进化保守位点和长程位点对其硝基化均产生重要影响。本文的分析结果有助于帮助理解酪氨酸的硝基化机制,并对进一步的实验研究提供重要的参考价值。
【学位授予单位】:南昌大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:Q51

【相似文献】
中国期刊全文数据库 前10条
1 张琪;张继权;严登华;佟志军;刘兴朋;;朝阳市玉米不同生育阶段干旱灾害风险预测[J];中国农业气象;2011年03期
2 马玉韬;车进;刘大铭;;基于傅里叶分析的蛋白质编码区预测中功率谱密度计算方法研究[J];宁夏大学学报(自然科学版);2011年02期
3 翟海军;张刚;张瑾;;基于线性回归的相关查询推荐[J];高技术通讯;2010年06期
4 郭会灿;;蛋白质翻译后修饰研究进展[J];生物技术通报;2011年07期
5 李兰春;王双成;王辉;;学生综合素质评估的层次贝叶斯网络聚类方法[J];东北师大学报(自然科学版);2011年03期
6 许彦平;姚晓红;乔艳君;;甘肃小陇山林区甘肃鼢鼠危害面积的气象预测预报技术研究[J];地球科学进展;2011年08期
7 李刚;赵静;李家星;林凌;佟颖;张宝菊;;近红外反射光谱用于冠心病快速筛查[J];天津大学学报;2011年08期
8 安娜;;蛋白质相互作用的研究技术及其在植物中的应用[J];黑龙江科技信息;2011年22期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 何明华;;浅谈如何提高市场预测准确率[A];湖北省烟草学会2007年学术年会论文集[C];2007年
2 刘银坤;;疾病蛋白质组学研究重点和临床应用展望[A];中华医学会第七次全国检验医学学术会议资料汇编[C];2008年
3 高飞;;泛素样蛋白NEDD8对乳腺癌相关蛋白3(BCA3)的修饰及BCA3对NFκB活性的抑制[A];中国细胞生物学学会2005年学术大会、青年学术研讨会论文摘要集[C];2005年
4 刘俊峰;王新泉;王占新;安晓敏;常文瑞;梁栋材;;造血干细胞中特异表达新基因kd93的重组表达和晶体结构研究[A];中国科协2005年学术年会生物物理与重大疾病分会论文摘要集[C];2005年
5 林东海;;用异核多维NMR技术测定蛋白质的溶液结构[A];第十四届全国波谱学学术会议论文摘要集[C];2006年
6 陈明杰;王焕峰;刘伟;;基于基团编码的蛋白质二级结构预测[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
7 徐加豹;蔡浩洋;张义正;李校;;基于基因网络预测哺乳动物线粒体蛋白质的功能[A];中国遗传学会第八次代表大会暨学术讨论会论文摘要汇编(2004-2008)[C];2008年
8 王丹;陈锦华;兰小鹏;江艺;;血清谷氨酸脱氢酶对肝移植患者的预后评价[A];第十届全军检验医学学术会议论文汇编[C];2005年
9 张小伟 ;张群业 ;鲁静 ;黄秋花;;全反式维甲酸诱导NB4细胞分化蛋白组中蛋白修饰及Isoforms变化的初步研究[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
10 范德新;张鹏;吴锐涛;汤德新;汤建国;;影响预报预测准确率和服务满意率因素分析及对策[A];第七届长三角气象科技论坛论文集[C];2010年
中国重要报纸全文数据库 前10条
1 李蕾;湖北负荷预测准确率上升[N];华中电力报;2005年
2 记者 吴仲国;日首次公开招募研究人员[N];科技日报;2001年
3 潘建设;如何提高客户预置订单的准确率[N];经理日报;2006年
4 本报记者  潘建梁;4月份研究员业绩预测准确率排名火热出炉[N];上海证券报;2006年
5 通讯员 陈力玮;依托技术创新带动管理创新[N];中国电力报;2008年
6 本报评论员;稳扎稳打 切实提高预报预测准确率[N];中国气象报;2008年
7 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
8 林琳刘晓林;贯彻落实十七大精神 提高预报预测准确率[N];中国气象报;2007年
9 采访记者 姜洪良;弱碱性活蛋白 创造蛋白质功能的升级[N];中国食品质量报;2005年
10 章凤英 记者 陈明喜;南烟“订单供货”取得良好开局[N];南昌日报;2007年
中国博士学位论文全文数据库 前10条
1 施绍萍;基于支持向量机的蛋白质功能预测新方法研究[D];南昌大学;2012年
2 蔡从中;支持向量机及其在生物材料功能研究中的应用[D];重庆大学;2003年
3 马志强;蛋白质功能预测的非同源性计算方法研究[D];吉林大学;2009年
4 董少忠;一个HSV-1刺激相关基因的克隆及其功能的初步分析[D];中国协和医科大学;2003年
5 李健峰;与HSV-1感染相关的细胞立即早期基因产物HTRP在细胞辅抑制因子复合物中功能的分析[D];中国协和医科大学;2004年
6 陈义明;基于分类的蛋白质功能预测技术研究[D];国防科学技术大学;2010年
7 周宏;转轨时期我国银行信用风险实证研究[D];吉林大学;2007年
8 石鸥燕;蛋白质结构预测模型的研究[D];天津医科大学;2008年
9 王琪;软件质量预测模型中的若干关键问题研究[D];上海交通大学;2007年
10 段谟杰;蛋白质结构预测与结构比对方法的研究[D];华中科技大学;2009年
中国硕士学位论文全文数据库 前10条
1 李希;基于序列特征的蛋白质功能类预测方法研究[D];湖南大学;2010年
2 邓小龙;基于随机游走的蛋白质功能预测方法的研究[D];吉林大学;2012年
3 王博;基于频繁功能模式的蛋白质功能预测[D];吉林大学;2012年
4 闫蓬勃;蛋白质二级结构预测准确率影响因素探讨[D];河北大学;2009年
5 罗三华;小波支持向量机在蛋白质结构功能预测中的应用[D];南昌大学;2008年
6 龚小龙;SAPs对蛋白质功能影响特征分析及性能评估[D];华中科技大学;2011年
7 吴超;蛋白质功能预测的半监督学习算法研究[D];福建农林大学;2011年
8 景楠;基于神经网络方法蛋白质二级结构预测的研究[D];吉林大学;2004年
9 周少华;基于ANN和GT的固井质量预测及施工参数优化设计研究[D];大庆石油学院;2008年
10 吴君;基于人工神经网络的足月胎儿体重预测[D];四川大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026