收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

小波支持向量机在蛋白质结构功能预测中的应用

罗三华  
【摘要】: 随着人类基因组计划(HGP)的顺利完成和现在生物科学和技术的迅猛发展,每天都有大量的蛋白质序列数据不断涌现。对这些数据进行深入研究以达到对化学和生物意义的深入理解是现代生物信息学的热点。蛋白质结构分析的经典方法是x射线晶体学和多维核磁共振技术。这些技术昂贵、费时、甚至有些蛋白质根本无法用这些方法测出结构;而另一方面,蛋白质测序显得相对简单、快捷和廉价。因此,从蛋白质序列出发,发展自动、可靠的理论预测方法具有十分重要的理论意义和实用价值。本文根据蛋白质结构、功能的预测研究现状,采用新兴的机器学习方法—支持向量机,并结合离散小波变换技术,对蛋白质的结构与功能预测进行研究,其主要内容如下: 1.提出了预测蛋白质二级结构的新方法—小波支持向量机方法。本文定义了一种新颖的蛋白质序列表征方法,用于表征蛋白质样本,采用小波支持向量机对蛋白质的二级结构类型进行预测。对文献中常用的非同源蛋白质的数据集进行了自检验和留一法检验,预测结果得到了显著提高。在此基础上,进一步深入研究蛋白质序列的同源性对预测准确率的影响;对Chou构建的高同源蛋白质数据库(同源性高于95%)和Wang构建的低同源蛋白质数据库(同源性为30%)进行了测试,结果表明,蛋白质序列的同源性对蛋白质二级结构预测的准确率有较大的影响。 2.建立了酶与非酶分类预测的新方法。以代码为1A2J酶蛋白为例,描述了应用离散小波变换提取酶结构特征向量的过程;并对小波尺度、小波函数和疏水标度值等影响因素进行了探讨和优化。采用Paul等人构建的数据库P1178,以及Cai等人构建的数据集C1200对本方法进行了验证,总的预测精度分别达到了95.59%和93.75%,优于现有文献的报道。同时,还分析了预测结果出现偏差的原因。结果表明,离散小波能有效地解析氨基酸序列信号,并有力地从小波分解系数提取酶蛋白序列的结构特征;与国际上流行的方法相比,本法具有预测简单、直观和准确率高等优点。 3.建立了凋亡蛋白亚细胞位点预测新方法。基于离散小波技术,提出了小波支持向量机方法,用于凋亡蛋白亚细胞位点定位研究。本方法主要包括三个步骤,首先应用氨基酸疏水值将蛋白质氨基酸序列转换为数字信号,然后利用信号处理工具—离散小波变换提取凋亡蛋白的时-频特征,最后根据优选的时-频特征用支持向量机进行模拟预测。对Zhou和Doctor建立的标准数据集ZD98、Zhang等人的数据集ZW225,以及Chou和Lin建立的数据集CL317进行了Jackknife检验,预测精度分别为88.8%,87.6%和97.5%,优于多数文献报道的方法。由于该方法仅仅基于氨基酸序列就可以对蛋白质结构类进行分类识别,这将有助于解决当蛋白质结构实验数据缺乏的情况下亚细胞位点的预测问题。 4.建立了一种膜蛋白类型预测新方法。现有蛋白质亚细胞定位方法针对水溶性蛋白质而设计,对跨膜蛋白并不适用。本文提出了一种预测膜蛋白结构类型的新方法。该方法将小波分析技术与支持向量机算法有机结合,利用小波变换多分辨原理对氨基酸序列进行特征提取,进而将筛选的特征值输入到支持向量机分类器中用来识别膜蛋白结构类型。数据集中测试结果表明,此方法性能优于多数文献报道的方法,是一种有效的膜蛋白结构类型预测的方法。 以上蛋白质分类预测技术都已编写了完整的处理程序,可以极为方便地使用。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陆剑锋;何剑中;;可食用昆虫资源的利用历史、现状及展望[J];食品科学;2006年12期
2 张力;;急待开发的蛋白质资源——大豆[J];河南科技;1985年02期
3 张曰鉴;;给头发“加强营养”[J];科学之友;1998年02期
4 翟洪民;张美芹;;昆虫上桌 味美价高[J];山东农机化;2007年07期
5 翟洪民;;介绍几种可食用昆虫[J];湖北畜牧兽医;2007年06期
6 刘吉生;;影响老年人血清铁结合力的因素[J];国外医学.老年医学分册;1983年02期
7 ;延长母鸡产蛋高峰期八法[J];黑龙江科技信息;1998年08期
8 宋汉英;;广辟蛋白饲源 提高配合饲料营养水平[J];今日科技;1981年03期
9 刘向东;;发热对人体有什么影响?[J];生物学通报;1991年07期
10 里姆森;;豆腐最好与三种食物同吃[J];今日科苑;2008年23期
11 ;废羽毛试制“口服水解蛋白”[J];今日科技;1974年06期
12 Alan Long;史久华;;素食者营养良好[J];世界科学;1982年04期
13 朱秀敏;李海燕;高振魁;;蛋白质三种内在平衡是人体健康的重要因素[J];科技信息;2007年06期
14 张琳;孟庆君;;猪的营养与免疫研究进展[J];养殖技术顾问;2008年03期
15 DOUGLAS M.;CONSIDINE P.E.;高国人;;玉米化学含量与营养部分 玉米的病虫害[J];海南大学学报(自然科学版);1989年01期
16 熊祥玲;;漫话蛋白质[J];云南科技管理;2011年05期
17 高兰兴;王宗印;陈玉珍;章广远;顾景范;;国产复方结晶氨基酸注射液临床效用初步观察[J];氨基酸和生物资源;1980年01期
18 杨家驹;;暗适应与夜间视力[J];四川生理科学杂志;1988年Z1期
19 李振 ,李萍;蛋白质营养与家禽免疫[J];中国饲料;2002年18期
20 董凤莲,杨福,杨发;浅谈引起动物的免疫抑制的因素[J];畜牧兽医科技信息;2004年10期
中国重要会议论文全文数据库 前10条
1 何志谦;;关于临床营养的一些进展[A];四川省营养学会96年学术会议专题报告及论文摘要汇编[C];1996年
2 ;健康下酒菜的做法[A];“食品安全质量检测技术”试刊论文集[C];2008年
3 陈仁惇;;医院病人的营养评价方法[A];全国临床营养工作座谈会资料汇编[C];1985年
4 高兰兴;王宗印;章广远;陈玉珍;顧景范;;复方结晶氨基酸溶液的营养效用[A];中国生理科学会第二届全国营养专业学术会议论文摘要汇编[C];1979年
5 屠琴芳;;以魚蛋白为原料酶解法制备水解蛋白注射液[A];中国生理科学会第二届全国营养专业学术会议论文摘要汇编[C];1979年
6 胡兴昌;阮家超;杨毓瑛;褚文浩;滕松茂;;高浓度氨肽对小鼠胸腺细胞生长的影响[A];动物学专辑——上海市动物学会1999年年会论文集[C];1999年
7 蒋文翔;余宗寿;邱光伟;;浅谈宣威市蛋白质饲料资源的开发及利用[A];云南省首届无公害猪肉生产研讨会、云南省奶业发展对策研讨会论文集[C];2004年
8 旺其格;巴那;;试论以蒙医理论诊治脂肪肝[A];中国民族医药学会首届研讨会论文汇编[C];1996年
9 周剑平;孙智敏;王治业;杨晖;张文齐;赵小锋;魏甲乾;;废弃蛋白的资源化综合利用技术研究[A];循环农业与新农村建设——2006年中国农学会学术年会论文集[C];2006年
10 陈静;谢成瑶;申丽丽;;影响伤口愈合的相关因素及护理对策[A];全国外科护理学术交流暨专题讲座会议论文汇编[C];2008年
中国硕士学位论文全文数据库 前6条
1 王辅臣;鳙鱼的慢沉性饲料加工工艺及其对蛋白质适宜需要量的研究[D];武汉工业学院;2012年
2 王信喜;饲粮赖氨酸水平对仔鹅生长性能、屠宰性能和血液生化指标的影响[D];扬州大学;2012年
3 杨立新;人胰岛素原基因非β细胞表达质粒的构建[D];中国医科大学;2003年
4 包铧;维持性血液透析患者贫血相关因素的研究[D];浙江大学;2005年
5 赵健楠;日粮能量与蛋白的互作效应对生长前期北京鸭生长发育的影响[D];西北农林科技大学;2010年
6 杨学圳;大麦虫幼虫蛋白质酶解工艺及其酶解产物对KM小鼠体力、智力的影响研究[D];四川农业大学;2013年
中国重要报纸全文数据库 前10条
1 晓昭;蛋白质缺乏症[N];河南科技报;2004年
2 陈贵善;鸡蛋白质缺乏的防治[N];云南科技报;2007年
3 北京中医药大学教授 边同华 陈启瑞;蛋白质缺乏与阴阳失调[N];中国消费者报;2002年
4 李峰;蛋白质粉并非人人适用[N];中国食品报;2010年
5 朱本浩;常吃宴席疾病多[N];中国医药报;2006年
6 吴翔 郭怡红;专家抨击林光常的保健歪理[N];江苏科技报;2007年
7 本期指导 辽宁省人民医院传染科主任、主任医师 刘杰 记者 杨春霞;乙肝患者春节期间的“吃喝玩乐”[N];医药导报;2007年
8 郑卫东;猪光吃不长膘是啥原因?[N];云南科技报;2006年
9 朱本浩;别用牙齿为自己掘坟[N];中国妇女报;2006年
10 ;视力好为何患上角膜溃疡?[N];健康时报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978