收藏本站
ȍ2*].PEȍ2*].input id="txt_word" class="left" size="100" type="text" value="" onkeydown="if(event.keyCode==13)document.getElementById('searchbtn').focus();" onmousedown="if(this.value=='输入关键词') this.value='';">
《南昌大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

基于支持向量机的蛋白质功能预测新方法研究

施绍萍  
【摘要】:随着人类进入后基因组时代,基因功能的注释已成为科学研究的焦点问题。依据中心法则,记录遗传信息的基因必须翻译成蛋白质才能执行其功能,因而蛋白质功能的研究变得至关重要。虽然可以通过实验方法确定蛋白质的功能,但是实验方法费时、费力且费用昂贵,无法满足在全基因组范围内对蛋白质功能进行注释的需要。因此,发展可靠、经济和高通量的蛋白质功能预测方法成为一项迫切任务。本文根据蛋白质功能预测的研究现状,基于机器学习方法支持向量机,从氨基酸序列出发,设计了一系列蛋白质序列的特征表达新编码方法,对蛋白质的功能进行预测研究,主要工作概括如下: 1.建立了线粒体和叶绿体亚结构预测的新方法。从氨基酸的极性和疏水性出发,基于离散小波变换特征提取方法,提出了一种新的伪氨基酸成分特征编码方法,成功应用于线粒体和叶绿体蛋白质的区分。在此基础上进一步预测了线粒体和叶绿体亚结构,各类亚结构的预测准确率比现有方法提高了3.7%~22.1%,尤其是线粒体外膜和叶绿体内囊体腔的预测结果有极大改进。这些结果表明离散小波变换不仅可以消除氨基酸序列中的噪声成分干扰,而且可以有效地提取整条蛋白序列的次序信息。此外,对线粒体和叶绿体两种蛋白质物理化学性质进行了讨论,发现线粒体蛋白质中极性特征更明显,而叶绿体蛋白质中疏水特征更显著。 2.构建了蛋白质精氨酸和赖氨酸甲基化修饰位点预测模型PMeS。提出了一种新的位置权重氨基酸成分去反映修饰位点附近残基的位置信息,并将其与氨基酸属性编码和溶剂可及表面面积融合去捕获甲基化位点的特征信息。10-倍交叉验证结果显示,PMeS的特征编码方法对甲基化状态的识别十分有效。同时,对特征的选择、窗口长度、正负样本比例和模型的稳定性进行了深入探讨。不同交叉验证和独立测试的结果表明,PMeS模型稳定可靠且明显优于其它预测工具。基于PMeS模型,我们构建了精氨酸和赖氨酸甲基化修饰位点的在线预测服务网站(http://bioinfo.ncu.edu.cn/inquiries_PMeS.aspx)。 3.建立了同时预测完整蛋白上赖氨酸残基的甲基化和乙酰化修饰位点的新方法PLMLA。该方法通过属性分组重量编码、位置权重氨基酸成分和二级结构分别提取修饰位点附近的物理化学属性、序列信息和结构特征。对甲基赖氨酸、乙酰赖氨酸和非甲基化与非乙酰化赖氨酸在残基的位置特异属性、物理化学性质和二级结构方面的特征差异进行了详细分析。基于不同训练特征的预测结果揭示,具有多特征融合的预测模型能充分利用不同特征之间的互补信息去改进模型的预测性能。基于独立测试与其它方法进行了比较,PLMLA对甲基赖氨酸的预测准确率比BPB-PPMS和MASA的分别高30.3%和37.88%;对乙酰赖氨酸的预测准确率比LysAcet和N-Ace的相应结果分别高33.33%和36.11%。这充分表明PLMLA方法极大地改进了甲基赖氨酸和乙酰赖氨酸的预测研究现状,是识别赖氨酸残基甲基化和乙酰化修饰的有效工具。最后,我们构建了基于氨基酸序列即可对完整蛋白质序列上赖氨酸的甲基化和乙酰化修饰位点同时进行预测分析的在线服务平台(http://bioinfo.ncu.edu.cn/inquiries_PLMLA.aspx)。 4.开发了酪氨酸硝基化位点预测的新方法。采用氨基酸残基信息熵和二肽关联熵优化窗口,结合氨基酸的物理化学性质和结构特征构建了蛋白质酪氨酸硝基化位点的预测模型。对信息熵优化窗口和传统连续窗口进行了初步探讨,结果显示信息熵窗口能够有效捕获酪氨酸硝基化肽段上的重要位点,克服短肽序列易丢失信息而单纯增大肽段长度又会引入冗余信息的矛盾,并有效提高模型的预测性能。特征分析揭示酪氨酸残基的局部静电环境、邻近的进化保守位点和长程位点对其硝基化均产生重要影响。本文的分析结果有助于帮助理解酪氨酸的硝基化机制,并对进一步的实验研究提供重要的参考价值。
【学位授予单位】:南昌大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:Q51

【参考文献】
中国期刊全文数据库 前3条
1 王明会;李春华;陈慰祖;王存新;;基于信息熵的磷酸化作用预测[J];中国科学(C辑:生命科学);2007年06期
2 刘金凤;王京兰;钱小红;蔡耘;;翻译后修饰蛋白质组学研究的技术策略[J];中国生物化学与分子生物学报;2007年02期
3 蒋英芝;贺连华;刘建军;;蛋白质功能研究方法及技术[J];生物技术通报;2009年09期
中国博士学位论文全文数据库 前1条
1 蔡从中;支持向量机及其在生物材料功能研究中的应用[D];重庆大学;2003年
【共引文献】
中国期刊全文数据库 前10条
1 何池洋;LM优化反向传播网络同时测定铜钴镍锌[J];安庆师范学院学报(自然科学版);2005年02期
2 李晶,王振国,陈裕明,唐湘蓉;小波包变换叠前地震资料去噪方法研究[J];成都理工大学学报(自然科学版);2003年05期
3 李敏;武小红;郭先定;;基于小波多分辨率分析的电网谐波检测法[J];电气应用;2006年01期
4 狄长安;孔德仁;王昌明;刘兵;;基于小波分析的水下弹丸速度测量[J];弹箭与制导学报;2004年S5期
5 郭巧玲;杨云松;畅祥生;陈志辉;;1957-2008年黑河流域径流年内分配变化[J];地理科学进展;2011年05期
6 梁晓刚;张永昌;翟弘泰;;LabVIEW与Matlab混合编程的实现[J];电脑开发与应用;2009年09期
7 秦丹丹;;基于MATLAB的B样条小波程序的实现[J];电脑知识与技术;2010年16期
8 张品秀;黄操军;梁春英;韩静;;MATLAB在电气工程专业实验教学中的应用[J];大庆师范学院学报;2010年03期
9 苏战涛,吕艳萍;一种基于小波包分析的小电流接地电网单相接地故障选线新方法[J];电网技术;2004年12期
10 赵晓丹;色谱工作站软件系统设计[J];上海电力学院学报;2005年02期
中国重要会议论文全文数据库 前1条
1 姜涛;丁吉;;基于Matlab的FIR数字滤波器的设计[A];增强自主创新能力促进吉林经济发展——启明杯·吉林省第四届科学技术学术年会论文集(上册)[C];2006年
中国博士学位论文全文数据库 前10条
1 彭富强;多尺度线调频基稀疏信号分解及其在齿轮箱故障诊断中的应用[D];湖南大学;2010年
2 李惠华;龙眼体胚发生过程中激素代谢和信号转导相关基因的克隆与表达[D];福建农林大学;2010年
3 于涛;蛋白质的结构特征及氯通道蛋白质的离子输运特性研究[D];武汉大学;2009年
4 张胜利;蛋白质与RNA中的若干问题研究[D];大连理工大学;2011年
5 蔡英卿;龙眼体胚发生过程中SERK等胚性相关基因的克隆与表达分析[D];福建农林大学;2011年
6 刘燕;竖直管内汽(气)液固多相流动沸腾过程的流体动力学研究[D];河北工业大学;2010年
7 许洁;基于统计理论的工业过程性能监控与故障诊断研究[D];南京航空航天大学;2010年
8 刘礼平;基于机床附件化的旋转超声波加工关键技术研究[D];天津大学;2012年
9 马军伟;基于机器学习方法的蛋白质亚细胞定位预测研究[D];大连理工大学;2011年
10 张平;集成化声发射信号处理平台的研究[D];清华大学;2002年
中国硕士学位论文全文数据库 前10条
1 田禹;煤岩双相介质弹性波场数值模拟[D];山东科技大学;2010年
2 史舵;基于主成分分析方法的蛋白质亚细胞定位[D];大连理工大学;2010年
3 徐晓辉;小管径气液两相流光学测量系统[D];浙江大学;2011年
4 夏琦;基于SVM的配电网故障选线与测距[D];昆明理工大学;2010年
5 胡晓娜;面向无线传感器网络数据处理的节能机制研究[D];东华大学;2011年
6 张松林;基于电导波动信号的油水两相流流型识别[D];东北电力大学;2011年
7 牛振华;矿井通风机故障诊断专家系统的研究[D];河南理工大学;2007年
8 周小波;基于最大隶属原则的核磁共振波谱模糊识别[D];辽宁师范大学;2011年
9 张占南;基于RBF神经网络的γ能谱分析[D];辽宁师范大学;2011年
10 韩伟;基于高斯声束模型的超声检测仿真技术研究[D];中北大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 蔡从中,韩连漪,王万录,陈宇综;支持向量机程序SVMProt预测SARS病毒蛋白质的功能[J];重庆大学学报(自然科学版);2003年09期
2 苏薇薇;计算机辅助的色谱、光谱-聚类分析法在中药鉴定中的应用[J];广东药学院学报;1996年02期
3 田盛丰,黄厚宽,李洪波;基于支持向量机的手写体相似字识别[J];中文信息学报;2000年03期
4 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
5 陶卿;姚穗;范劲松;方廷健;;一种新的机器学习算法:Support Vector Machines[J];模式识别与人工智能;2000年03期
6 卢增祥,李衍达;交互支持向量机学习算法及其应用[J];清华大学学报(自然科学版);1999年07期
7 苏薇薇;聚类分析法在砂仁及其伪品鉴别分类中的应用[J];数理医药学杂志;1998年02期
8 张缙熙;乳腺超声的现状及展望[J];中国超声医学杂志;1995年04期
9 苏薇薇;聚类分析法在黄芩鉴别分类中的应用[J];中国中药杂志;1991年10期
10 苏薇薇;中药方剂的计算机辅助分析[J];中国中药杂志;1997年03期
【相似文献】
中国期刊全文数据库 前10条
1 刘秀艳,滕胜;应用计算机识别蛋白质功能[J];生命的化学;2000年03期
2 曾岚,徐晋麟,李亦学,石铁流;大规模蛋白质功能预测方法的进展[J];生命的化学;2005年01期
3 卢宏超;石秋艳;石宝晨;张治华;赵屹;唐素勤;熊磊;王强;陈润生;;基于蛋白质网络功能模块的蛋白质功能预测[J];生物化学与生物物理进展;2006年05期
4 王繁业;李亚非;;用于新药开发的新的蛋白质功能预测方法[J];化学与生物工程;2006年09期
5 王秀鹤;王正华;王勇献;张振慧;;基于分组重量编码的蛋白质功能预测[J];生物信息学;2007年01期
6 倪青山;王正志;黎刚果;孟祥林;;基于K近邻的蛋白质功能的预测方法[J];生物医学工程研究;2009年02期
7 蒋英芝;贺连华;刘建军;;蛋白质功能研究方法及技术[J];生物技术通报;2009年09期
8 胡敏菁;吴建盛;施识帆;刘宏德;孙啸;;面向蛋白质功能位点识别的机器学习平台构建[J];生物信息学;2010年01期
9 赵研;卢奕南;权勇;;基于模糊积分多源数据融合的蛋白质功能预测[J];南京大学学报(自然科学版);2012年01期
10 吴建盛;;基于新型机器学习方法的蛋白质功能预测与分析[J];信息通信;2012年05期
中国重要会议论文全文数据库 前10条
1 卢乃浩;张燕;李海玲;高中洪;;蛋白质酪氨酸硝化修饰对蛋白质功能影响及抗氧化剂的作用[A];第六届全国化学生物学学术会议论文摘要集[C];2009年
2 郭延芝;李梦龙;;蛋白质功能预测中的特征筛选与优化[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
3 汪世华;;蛋白质芯片用于快速检测的研究[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
4 郭延芝;文志宁;李梦龙;;基于序列信息的蛋白质功能预测[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
5 王靖;李霞;高磊;朱明珠;杨德武;;蛋白质功能位点和结构域与人类蛋白质互作关联分析[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
6 刘克良;梁远军;;肽类药物研究进展[A];2006第六届中国药学会学术年会大会报告集[C];2006年
7 刘俊峰;王新泉;王占新;安晓敏;常文瑞;梁栋材;;造血干细胞中特异表达新基因kd93的重组表达和晶体结构研究[A];中国科协2005年学术年会生物物理与重大疾病分会论文摘要集[C];2005年
8 常珊;李春华;龚新奇;陈慰祖;王存新;;蛋白质不同区域的氨基酸保守性网络分析[A];第十次中国生物物理学术大会论文摘要集[C];2006年
9 张长胜;来鲁华;;基于关键相互作用的蛋白质功能设计[A];第五届全国化学生物学学术会议论文摘要集[C];2007年
10 李亦学;;蛋白质组功能注释[A];中国蛋白质组学第二届学术大会论文摘要论文集[C];2004年
中国重要报纸全文数据库 前4条
1 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
2 刘云涛;北大蛋白质功能设计研究获新进展[N];中国医药报;2007年
3 记者 吴仲国;日首次公开招募研究人员[N];科技日报;2001年
4 华琳 王治强;我校三项“973”项目通过科技部验收[N];新清华;2005年
中国博士学位论文全文数据库 前8条
1 孙承磊;基于数据挖掘技术的蛋白质功能预测研究[D];上海大学;2013年
2 窦永超;预测蛋白质功能位点的几种新数学模型[D];大连理工大学;2011年
3 施绍萍;基于支持向量机的蛋白质功能预测新方法研究[D];南昌大学;2012年
4 俞晓晶;基于蛋白质序列和生物医学文献的蛋白质功能挖掘[D];中国科学院研究生院(上海生命科学研究院);2006年
5 张同亮;基于智能计算的蛋白质功能预测研究[D];东华大学;2008年
6 马志强;蛋白质功能预测的非同源性计算方法研究[D];吉林大学;2009年
7 陈义明;基于分类的蛋白质功能预测技术研究[D];国防科学技术大学;2010年
8 张拓;两种特殊类型蛋白质功能残基的预测与生物序列比对[D];南开大学;2009年
中国硕士学位论文全文数据库 前10条
1 王博;基于频繁功能模式的蛋白质功能预测[D];吉林大学;2012年
2 赵研;模糊积分在蛋白质功能预测上的应用[D];吉林大学;2012年
3 李希;基于序列特征的蛋白质功能类预测方法研究[D];湖南大学;2010年
4 王秀鹤;基于序列和相互作用的蛋白质功能预测[D];国防科学技术大学;2006年
5 邓小龙;基于随机游走的蛋白质功能预测方法的研究[D];吉林大学;2012年
6 贾元丰;基于复杂网络社团结构与贝叶斯网络模型的蛋白质功能预测[D];山西大学;2013年
7 刘昊;基于聚类算法和相互作用网络的蛋白质功能预测研究[D];湖南大学;2009年
8 黄丹梅;多分类器系统在蛋白质功能预测方面的应用[D];吉林大学;2010年
9 蔡娟;基于蛋白质相互作用网络及聚类算法的蛋白质功能预测方法研究[D];中南大学;2012年
10 黄淑云;基于序列的蛋白质功能预测研究[D];南昌大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026