收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于支持向量机的蛋白质分类研究

张绍武  
【摘要】:随着人类基因组计划的顺利进展,越来越多的蛋白质序列被测定出来;而通过实验确定其结构与功能的蛋白质序列则相对较少,且两者之间的差距有迅速扩大的趋势。由于通过实验确定蛋白质的结构和功能费时、费力、费财,且实验中可能还会遇到一些目前无法解决的困难,因此探索利用理论及计算方法来研究蛋白质结构和功能具有重要意义。本文从蛋白质的一级序列出发,研究了蛋白质的结构、功能分类预测,其主要贡献如下: 1.提出一种新的组合分类思想,即将氨基酸组成成分、自相关函数二种特征提取法与支持向量机恰当组合,首次对蛋白质同源二聚体和非同源二聚体进行分类研究,并与国际上现有的Garian方法进行了对比。在10CV检验下,本文方法的分类总精度比Garian方法最大可提高17.1个百分点。 2.提出二种新的特征提取法,并引入以前已有的二种特征提取法,与支持向量机和不同的分类策略,进行恰当的组合构成分类系统,首次对蛋白质同源二聚体、同源三聚体、同源四聚体和同源六聚体进行分类研究。结果表明整合了氨基酸残基序列顺序信息的三种特征提取法,其分类能力均好于氨基酸组成成分特征提取法,尤以我们提出的加权自相关函数特征提取法的分类效果最好,其分类总精度可比氨基酸组成成分特征提取法最大可提高6.39个百分点,比Chou的特征提取法提高2.41个百分点;采用“一对一”策略的分类能力明显优于“一对多”策略,其分类总精度最大可提高17.69个百分点。 3.一种新的组合分类方法,即将自相关函数特征提取法和支持向量机、以及本文提出的“改进的唯一的一对多”分类策略恰当组合,应用于蛋白质折叠子分类研究。结果显示:对于独立测试样本,自相关函数特征提取法的分类总精度比氨基酸组成成分特征提取法,大约可提高7个百分点;“改进的唯一的一对多”分类策略优于“一对多”策略,其独立测试和5CV检验的分类总精度,比“一对多”策略最大可分别提高约18和12个百分点。 4.引入加权思想,以一种新的特征提取法—加权自相关函数,表示蛋白质序列,并采用“一对多”、“一对一”分类策略对膜蛋白和亚细胞定位进行了分类和预测研究,结果有明显改善: 1).对于膜蛋白分类,在采用支持向量机算法及“一对多”分类策略下,加权自相关函数特征提取法的分类总精度为87.98%,比氨基酸组成成分特征提取


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张绍武;潘泉;赵春晖;程咏梅;;基于加权自相关函数特征提取法的多类蛋白质同源寡聚体分类研究[J];生物医学工程学杂志;2007年04期
2 倪青山;王正志;王广云;强波;;基于局部支持向量机的蛋白质相互作用的预测方法[J];生物医学工程研究;2008年02期
3 邱天爽,郑效来,鲍海平,赵庚申;一种基于支持向量机技术的癫痫脑电棘尖波识别方法[J];生物物理学报;2005年04期
4 王双维;樊晓平;廖志芳;;一种激光诱导荧光光谱特征提取新方法[J];计算机工程与应用;2008年12期
5 牟华英;;用FastICA和Fisher准则提取脑电信号特征[J];科学技术与工程;2009年24期
6 付秀燕;王蓓;王行愚;;短时睡眠过程中睡眠阶段的特征提取和分类[J];华东理工大学学报(自然科学版);2011年01期
7 董书琴;谢宏;;基于CSP与SVM算法的警觉度脑电信号分类[J];微型机与应用;2011年16期
8 廖祥;尹愚;尧德中;;基于连续小波变换和支持向量机的手动想象脑电分类[J];中国医学物理学杂志;2006年02期
9 唐艳;汤井田;;基于支持向量机的脑电信号中左右手判别[J];计算机工程与应用;2007年34期
10 张云佳;方亚平;黄田海;张婧;谭福元;孙李娜;李梦龙;;主成分分析-支持向量机用于肝病分类模型[J];化学研究与应用;2008年02期
11 唐斌;杜曦;胡昕;;基于血常规支持向量机应用于肾病模型的预测[J];中国组织工程研究与临床康复;2008年52期
12 熊思;;基于SVM的乳腺癌X光照片计算机辅助诊断模型[J];湖北第二师范学院学报;2009年08期
13 楼恩平;张胜;;基于特征向量法和支持向量机的抑郁症脑电信号分类[J];中国医学物理学杂志;2009年05期
14 田絮资;赵鹏;黄力宇;;基于脑电模糊能量特征提取的癫痫分类诊断[J];西北大学学报(自然科学版);2010年04期
15 王蕊平;王年;苏亮亮;陈乐;;基于LNMF的癌症基因表达谱数据的特征提取[J];生物信息学;2011年02期
16 刘明宇;王珏;杨琴;郑崇勋;;基于融合规则的注意相关脑电分类算法研究[J];北京生物医学工程;2006年04期
17 冯津;王行愚;金晶;;基于支持向量机多分类器的运动想象电位识别[J];中国组织工程研究与临床康复;2008年09期
18 谭显胜;袁哲明;周铁军;熊洁仪;王春娟;;支持向量机及组合预测在蛋白质四级结构分类中的应用[J];现代生物医学进展;2008年04期
19 尧德中;刘铁军;雷旭;杨平;徐鹏;张杨松;;基于脑电的脑-机接口:关键技术和应用前景[J];电子科技大学学报;2009年05期
20 燕楠;王珏;魏娜;宗良;;基于样本熵的注意力相关脑电特征信息提取与分类[J];西安交通大学学报;2007年10期
中国重要会议论文全文数据库 前10条
1 郭小荟;马小平;;基于EMD近似熵特征提取和支持向量机的故障诊断方法[A];中国自动化学会控制理论专业委员会D卷[C];2011年
2 朱晓霞;孙同景;陈桂友;;基于支持向量机理论的两级指纹分类实现方法[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
3 蔡蕾;朱永生;;基于稀疏性非负矩阵分解和支持向量机的轴心轨迹图识别[A];2008年全国振动工程及应用学术会议暨第十一届全国设备故障诊断学术会议论文集[C];2008年
4 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
5 罗云林;徐文君;;基于支持向量机的航空发动机内窥损伤识别[A];2006中国控制与决策学术年会论文集[C];2006年
6 郭相科;刘进忙;曹学斌;张玉鹏;;子类独立分量分析在声目标识别中的应用[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年
7 李泽辉;聂生东;陈兆学;;应用多类SVM分割MR脑图像特征选择与优化的实验研究[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
8 詹玉龙;刘明明;李邦辉;;基于支持向量机的船用主柴油机气缸盖故障诊断[A];第十五届全国大功率柴油机学术会议论文集[C];2007年
9 徐继伟;李建中;柳勃;杨昆;;使用支持向量机和改进特征提取方法的蛋白质分类[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
10 宋杰;唐焕文;;基于支持向量机方法的同源寡聚蛋白质分类[A];中国运筹学会第七届学术交流会论文集(下卷)[C];2004年
中国博士学位论文全文数据库 前10条
1 张绍武;基于支持向量机的蛋白质分类研究[D];西北工业大学;2004年
2 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
3 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
4 张超;基于支持向量机的汽轮机轴系振动故障智能诊断研究[D];华北电力大学(河北);2009年
5 唐静远;模拟电路故障诊断的特征提取及支持向量机集成方法研究[D];电子科技大学;2010年
6 周喜川;非可信环境下的支持向量机研究[D];浙江大学;2010年
7 蒋永华;旋转机械非平稳信号微弱特征提取方法研究[D];重庆大学;2010年
8 冯坤;基于内积变换的机械故障特征提取原理与早期识别方法研究[D];北京化工大学;2012年
9 翟永杰;基于支持向量机的故障智能诊断方法研究[D];华北电力大学(河北);2004年
10 赵海滨;脑—机接口的特征提取和分类方法研究[D];东北大学;2009年
中国硕士学位论文全文数据库 前10条
1 陈卫;基于支持向量机的说话人识别系统研究[D];华北电力大学(河北);2005年
2 陈军;基于支持向量机的脱机手写体汉字识别方法的研究[D];合肥工业大学;2006年
3 任爽;基于XML和SVM的Web文本挖掘研究[D];大连理工大学;2006年
4 唐孝;支持向量机(SVM)及其在心电图(ECG)分类识别中的应用[D];四川师范大学;2007年
5 王晓晶;支持向量机在脑功能模式识别和分类中的研究[D];天津师范大学;2009年
6 张淼;基于支持向量机的文本分类系统研究[D];大庆石油学院;2008年
7 周辉;齿轮故障的特征提取与模式识别技术研究[D];郑州大学;2005年
8 朱丹红;数字图书馆基于内容的图像检索技术的研究[D];福州大学;2006年
9 赵智超;基于数据挖掘的沙尘暴智能预报系统的研究[D];天津大学;2005年
10 张晓飞;基于支持向量机的图像信息分类与检索[D];沈阳大学;2007年
中国重要报纸全文数据库 前10条
1 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
2 沈占锋;遥感影像信息提取与分析[N];计算机世界;2006年
3 王竣;深入开发CAD系统对疾病诊断有重要意义[N];中国医药报;2007年
4 吴昱;QoS——IP业务的根本保证[N];人民邮电;2007年
5 阿朗;阿尔卡特朗讯拓展IP赢利空间[N];通信产业报;2007年
6 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
7 李水根;计算机详解配伍与药效关系[N];健康报;2005年
8 课题主持人 李心丹 课题协调人 上海证券交易所 施东晖 傅浩 课题研究员 宋素荣 查晓磊 宾红辉 张许宏 郭静静 黄隽 南京大学工程管理学院;内幕交易与市场操纵的行为动机与判别监管研究[N];中国证券报;2007年
9 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
10 孙哲南 谭铁牛;生物识别的十大关键技术[N];计算机世界;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978