收藏本站
《西北工业大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

基于支持向量机的蛋白质分类研究

张绍武  
【摘要】:随着人类基因组计划的顺利进展,越来越多的蛋白质序列被测定出来;而通过实验确定其结构与功能的蛋白质序列则相对较少,且两者之间的差距有迅速扩大的趋势。由于通过实验确定蛋白质的结构和功能费时、费力、费财,且实验中可能还会遇到一些目前无法解决的困难,因此探索利用理论及计算方法来研究蛋白质结构和功能具有重要意义。本文从蛋白质的一级序列出发,研究了蛋白质的结构、功能分类预测,其主要贡献如下: 1.提出一种新的组合分类思想,即将氨基酸组成成分、自相关函数二种特征提取法与支持向量机恰当组合,首次对蛋白质同源二聚体和非同源二聚体进行分类研究,并与国际上现有的Garian方法进行了对比。在10CV检验下,本文方法的分类总精度比Garian方法最大可提高17.1个百分点。 2.提出二种新的特征提取法,并引入以前已有的二种特征提取法,与支持向量机和不同的分类策略,进行恰当的组合构成分类系统,首次对蛋白质同源二聚体、同源三聚体、同源四聚体和同源六聚体进行分类研究。结果表明整合了氨基酸残基序列顺序信息的三种特征提取法,其分类能力均好于氨基酸组成成分特征提取法,尤以我们提出的加权自相关函数特征提取法的分类效果最好,其分类总精度可比氨基酸组成成分特征提取法最大可提高6.39个百分点,比Chou的特征提取法提高2.41个百分点;采用“一对一”策略的分类能力明显优于“一对多”策略,其分类总精度最大可提高17.69个百分点。 3.一种新的组合分类方法,即将自相关函数特征提取法和支持向量机、以及本文提出的“改进的唯一的一对多”分类策略恰当组合,应用于蛋白质折叠子分类研究。结果显示:对于独立测试样本,自相关函数特征提取法的分类总精度比氨基酸组成成分特征提取法,大约可提高7个百分点;“改进的唯一的一对多”分类策略优于“一对多”策略,其独立测试和5CV检验的分类总精度,比“一对多”策略最大可分别提高约18和12个百分点。 4.引入加权思想,以一种新的特征提取法—加权自相关函数,表示蛋白质序列,并采用“一对多”、“一对一”分类策略对膜蛋白和亚细胞定位进行了分类和预测研究,结果有明显改善: 1).对于膜蛋白分类,在采用支持向量机算法及“一对多”分类策略下,加权自相关函数特征提取法的分类总精度为87.98%,比氨基酸组成成分特征提取
【学位授予单位】:西北工业大学
【学位级别】:博士
【学位授予年份】:2004
【分类号】:Q51

【引证文献】
中国期刊全文数据库 前1条
1 张振慧;王正华;王勇献;;基于分组重量编码的蛋白质同源寡聚体分类研究[J];国防科技大学学报;2007年02期
中国博士学位论文全文数据库 前5条
1 李宏;面向应用领域的分类方法研究[D];中南大学;2007年
2 施建宇;蛋白质亚细胞定位特征表达与分类算法研究[D];西北工业大学;2006年
3 李凤敏;核蛋白的亚核定位和植物、非植物及小鼠蛋白质的亚细胞定位预测研究[D];内蒙古大学;2007年
4 胡秀珍;蛋白质的β-发夹、β(γ)-转角及四类简单超二级结构预测[D];内蒙古大学;2007年
5 刘辉;miRNA靶标预测的系统生物学方法研究[D];中国矿业大学;2009年
中国硕士学位论文全文数据库 前4条
1 安文娟;Fisher和支持向量综合分类器[D];辽宁师范大学;2010年
2 曾聪;膜蛋白分类的特征提取算法和数据集构建技术研究[D];国防科学技术大学;2010年
3 曲娟;同源寡聚蛋白质的信息熵分类方法[D];大连理工大学;2006年
4 姜彬;膜蛋白分类问题的特征提取算法研究[D];国防科学技术大学;2008年
【参考文献】
中国期刊全文数据库 前6条
1 孙啸;生物信息学——揭示生物分子数据的内涵[J];电子科技导报;1998年11期
2 张绍武,潘泉,陈润生,张洪才;基于支持向量机的蛋白质同源寡聚体分类研究[J];生物化学与生物物理进展;2003年06期
3 张绍武,潘泉,张洪才,张云龙,王海瑜;基于支持向量机和贝叶斯方法的蛋白质四级结构分类研究[J];生物物理学报;2003年02期
4 汤海旭,丁达夫;基于结构比较的蛋白质同源模建系统及其评估Ⅱ侧链的安装[J];生物物理学报;1996年01期
5 陈润生;生物信息学[J];生物物理学报;1999年01期
6 祝海龙,屈梁生,张海军;基于小波变换和支持向量机的人脸检测系统[J];西安交通大学学报;2002年09期
中国博士学位论文全文数据库 前1条
1 黄积涛;蛋白质结构、运动与功能[D];天津大学;2003年
【共引文献】
中国期刊全文数据库 前10条
1 杨绪兵,韩自存;ε不敏感的核Adaline算法及其在图像去噪中的应用[J];安徽工程科技学院学报(自然科学版);2003年04期
2 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
3 王建平;柴立和;;蛋白质分子网络的分形结构[J];安徽农业科学;2007年06期
4 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
5 郭立萍;唐家奎;米素娟;张成雯;赵理君;;基于支持向量机遥感图像融合分类方法研究进展[J];安徽农业科学;2010年17期
6 蔡渡江;王联结;;基于电子效应的氨基酸分类与二级结构的倾向性分析[J];安徽农业科学;2010年36期
7 徐新颜,徐家萍,徐静斐,吉鑫松,袁中一;丝素蛋白葡萄糖氧化酶膜的储存稳定性[J];安徽农业科学;1997年01期
8 付明哲;王联结;刘选治;;α-螺旋中2,3位氨基酸残基对螺旋结构稳定性的影响[J];安徽农业大学学报;2011年06期
9 冯学军;;最小二乘支持向量机的研究与应用[J];安庆师范学院学报(自然科学版);2009年01期
10 刘瑞英;;对数和不等式在信息论中的应用[J];保定学院学报;2008年02期
中国重要会议论文全文数据库 前10条
1 陈双平;郑浩然;王习书;王煦法;;生物序列的描述复杂性分析[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
3 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
4 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六届中国控制会议论文集[C];2007年
5 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
6 ;State Estimation Model of Ferment Process Based on PSO[A];第二十九届中国控制会议论文集[C];2010年
7 李鸿;马小平;;基于特征的粒表示研究[A];中国自动化学会控制理论专业委员会A卷[C];2011年
8 常俊林;魏巍;梁君燕;;基于支持向量机的SURF改进算法[A];中国自动化学会控制理论专业委员会C卷[C];2011年
9 ;Research of Intelligent Control Model and System on Traffic Light Time[A];中国自动化学会控制理论专业委员会D卷[C];2011年
10 庄绪静;曹雅忠;李克斌;尹姣;;同源建模和分子对接方法的应用与发展[A];植保科技创新与病虫防控专业化——中国植物保护学会2011年学术年会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 王冰;降解丝素放线菌的分离鉴定、发酵条件优化及其降解机制研究[D];山东农业大学;2009年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
4 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
5 张昌明;新疆汉族、维吾尔族及哈萨克族食管癌血清蛋白质指纹图谱研究[D];新疆医科大学;2010年
6 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
7 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
8 许伟;基于进化算法的复杂化工过程智能建模方法及其应用[D];华东理工大学;2011年
9 吴锋;基于GPU并行计算的数值模拟与燃煤锅炉系统的优化研究[D];浙江大学;2010年
10 向国齐;支持向量回归机代理模型设计优化及应用研究[D];电子科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨堃;鹅CYP7A1基因克隆、表达调节及表达规律的研究[D];华中农业大学;2010年
2 李红;苏云金芽胞杆菌YBT1520杀虫晶体突变株的蛋白质组学分析[D];华中农业大学;2010年
3 张志慧;米糠的微波稳定化及其油脂和蛋白质的提取研究[D];华中农业大学;2010年
4 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
5 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
6 谢进;抗鹅膏肽的全合成及其活性测定[D];中南林业科技大学;2009年
7 张艳萍;蛋白质序列的数学描述及其应用[D];浙江理工大学;2010年
8 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
9 刘磊;多泥沙河流水库优化调度研究[D];郑州大学;2010年
10 辛保兵;既有预应力混凝土梁桥剩余承载力评估方法研究[D];郑州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 王洪水;侯相山;;基因芯片技术研究进展[J];安徽农业科学;2007年08期
2 冉令华,阮晓钢;用支持向量机方法识别大肠杆菌启动子[J];北京工业大学学报;2004年04期
3 施建宇;潘泉;张绍武;邵壮超;姜涛;;基于多特征融合的蛋白质折叠子预测[J];北京生物医学工程;2006年05期
4 陈菊祥,楼美清,应康,卢亦成;基因芯片在恶性胶质瘤研究中的应用[J];第二军医大学学报;2000年09期
5 董火明,高隽,胡良梅;多分类器融合的指纹全局特征协同识别[J];电路与系统学报;2005年03期
6 余志文,于军,徐静平,周文利;神奇的基因芯片[J];电子元件与材料;2000年06期
7 孙啸;生物信息学——揭示生物分子数据的内涵[J];电子科技导报;1998年11期
8 李颖新,阮晓钢;基于基因表达谱的肿瘤亚型识别与分类特征基因选取研究[J];电子学报;2005年04期
9 喻红霞,胡建达;基因芯片的应用及其数据分析方法[J];福建医科大学学报;2005年02期
10 王正华,王勇献;后基因组时代生物信息学的新进展[J];国防科技大学学报;2003年01期
中国博士学位论文全文数据库 前10条
1 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年
2 靳利霞;蛋白质结构预测方法研究[D];大连理工大学;2002年
3 王明怡;微阵列数据挖掘技术的研究[D];浙江大学;2004年
4 安金龙;支持向量机若干问题的研究[D];天津大学;2004年
5 宋杰;生物信息数据挖掘中的若干方法及其应用研究[D];大连理工大学;2005年
6 许孝元;分类关联规则归纳算法及应用研究[D];华南理工大学;2005年
7 贺平;数据挖掘中的分类方法及其在质谱数据中的应用[D];四川大学;2005年
8 刘刚;数据挖掘技术与分类算法研究[D];中国人民解放军信息工程大学;2004年
9 任佳;分类关联规则挖掘及其在复杂工业过程中的应用研究[D];浙江大学;2006年
10 李伟红;基于支持向量机的人脸特征选择及识别研究[D];重庆大学;2006年
中国硕士学位论文全文数据库 前3条
1 魏兴国;基于核方法的手写体数字识别研究[D];南京理工大学;2003年
2 李凤敏;蛋白质亚细胞定位的序列分析和理论预测算法研究[D];内蒙古大学;2004年
3 姜彬;膜蛋白分类问题的特征提取算法研究[D];国防科学技术大学;2008年
【二级引证文献】
中国期刊全文数据库 前1条
1 刘红梅;;数据挖掘中分类方法探究[J];硅谷;2009年03期
中国博士学位论文全文数据库 前2条
1 孙鹏飞;基于计算智能技术的蛋白质结构预测方法研究[D];哈尔滨工程大学;2010年
2 郑婷婷;随机商分形模型及其在蛋白质分析中的应用[D];安徽大学;2007年
中国硕士学位论文全文数据库 前10条
1 李丹丹;基于支持向量机的G蛋白偶联特异性预测研究[D];华东师范大学;2011年
2 胡小弦;玉米胚乳发育两个时期相关microRNA研究[D];四川农业大学;2011年
3 曾聪;膜蛋白分类的特征提取算法和数据集构建技术研究[D];国防科学技术大学;2010年
4 于海瑛;膜蛋白跨膜螺旋结构预测研究[D];南京理工大学;2012年
5 贺栋;灰度图像颜色迁移算法研究[D];中北大学;2012年
6 王歌;针对H1N1的miRNA靶基因预测算法研究[D];吉林大学;2010年
7 贾伟峰;蛋白质序列特征提取及其在功能预测中的应用[D];湖南大学;2010年
8 武利;蛋白质二级结构类预测中的信息提取与预测方法研究[D];杭州电子科技大学;2012年
9 盛英;半监督特征降维及其在天文光谱数据中的应用[D];太原科技大学;2012年
10 许诺琳;基于多特征融合的固有不规则蛋白质结构预测器的设计[D];哈尔滨工程大学;2012年
【二级参考文献】
中国期刊全文数据库 前3条
1 冯祖康,丁达夫;用于蛋白质分子设计的环区模建方法[J];生物化学与生物物理学报;1995年02期
2 汤海旭,丁达夫;用于蛋白质同源模建及三维结构预测的结构比较方法[J];生物物理学报;1995年01期
3 丁达夫,汤海旭,张保红;基于结构比较的蛋白质模建系统及其评估[J];生物物理学报;1995年03期
【相似文献】
中国期刊全文数据库 前10条
1 张绍武;潘泉;赵春晖;程咏梅;;基于加权自相关函数特征提取法的多类蛋白质同源寡聚体分类研究[J];生物医学工程学杂志;2007年04期
2 倪青山;王正志;王广云;强波;;基于局部支持向量机的蛋白质相互作用的预测方法[J];生物医学工程研究;2008年02期
3 邱天爽,郑效来,鲍海平,赵庚申;一种基于支持向量机技术的癫痫脑电棘尖波识别方法[J];生物物理学报;2005年04期
4 王双维;樊晓平;廖志芳;;一种激光诱导荧光光谱特征提取新方法[J];计算机工程与应用;2008年12期
5 牟华英;;用FastICA和Fisher准则提取脑电信号特征[J];科学技术与工程;2009年24期
6 付秀燕;王蓓;王行愚;;短时睡眠过程中睡眠阶段的特征提取和分类[J];华东理工大学学报(自然科学版);2011年01期
7 董书琴;谢宏;;基于CSP与SVM算法的警觉度脑电信号分类[J];微型机与应用;2011年16期
8 廖祥;尹愚;尧德中;;基于连续小波变换和支持向量机的手动想象脑电分类[J];中国医学物理学杂志;2006年02期
9 唐艳;汤井田;;基于支持向量机的脑电信号中左右手判别[J];计算机工程与应用;2007年34期
10 张云佳;方亚平;黄田海;张婧;谭福元;孙李娜;李梦龙;;主成分分析-支持向量机用于肝病分类模型[J];化学研究与应用;2008年02期
中国重要会议论文全文数据库 前10条
1 郭小荟;马小平;;基于EMD近似熵特征提取和支持向量机的故障诊断方法[A];中国自动化学会控制理论专业委员会D卷[C];2011年
2 朱晓霞;孙同景;陈桂友;;基于支持向量机理论的两级指纹分类实现方法[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
3 蔡蕾;朱永生;;基于稀疏性非负矩阵分解和支持向量机的轴心轨迹图识别[A];2008年全国振动工程及应用学术会议暨第十一届全国设备故障诊断学术会议论文集[C];2008年
4 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
5 罗云林;徐文君;;基于支持向量机的航空发动机内窥损伤识别[A];2006中国控制与决策学术年会论文集[C];2006年
6 郭相科;刘进忙;曹学斌;张玉鹏;;子类独立分量分析在声目标识别中的应用[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年
7 李泽辉;聂生东;陈兆学;;应用多类SVM分割MR脑图像特征选择与优化的实验研究[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
8 詹玉龙;刘明明;李邦辉;;基于支持向量机的船用主柴油机气缸盖故障诊断[A];第十五届全国大功率柴油机学术会议论文集[C];2007年
9 徐继伟;李建中;柳勃;杨昆;;使用支持向量机和改进特征提取方法的蛋白质分类[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
10 宋杰;唐焕文;;基于支持向量机方法的同源寡聚蛋白质分类[A];中国运筹学会第七届学术交流会论文集(下卷)[C];2004年
中国重要报纸全文数据库 前10条
1 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
2 沈占锋;遥感影像信息提取与分析[N];计算机世界;2006年
3 王竣;深入开发CAD系统对疾病诊断有重要意义[N];中国医药报;2007年
4 吴昱;QoS——IP业务的根本保证[N];人民邮电;2007年
5 阿朗;阿尔卡特朗讯拓展IP赢利空间[N];通信产业报;2007年
6 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
7 李水根;计算机详解配伍与药效关系[N];健康报;2005年
8 课题主持人 李心丹 课题协调人 上海证券交易所 施东晖 傅浩 课题研究员 宋素荣 查晓磊 宾红辉 张许宏 郭静静 黄隽 南京大学工程管理学院;内幕交易与市场操纵的行为动机与判别监管研究[N];中国证券报;2007年
9 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
10 孙哲南 谭铁牛;生物识别的十大关键技术[N];计算机世界;2007年
中国博士学位论文全文数据库 前10条
1 张绍武;基于支持向量机的蛋白质分类研究[D];西北工业大学;2004年
2 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
3 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
4 张超;基于支持向量机的汽轮机轴系振动故障智能诊断研究[D];华北电力大学(河北);2009年
5 唐静远;模拟电路故障诊断的特征提取及支持向量机集成方法研究[D];电子科技大学;2010年
6 周喜川;非可信环境下的支持向量机研究[D];浙江大学;2010年
7 蒋永华;旋转机械非平稳信号微弱特征提取方法研究[D];重庆大学;2010年
8 冯坤;基于内积变换的机械故障特征提取原理与早期识别方法研究[D];北京化工大学;2012年
9 翟永杰;基于支持向量机的故障智能诊断方法研究[D];华北电力大学(河北);2004年
10 赵海滨;脑—机接口的特征提取和分类方法研究[D];东北大学;2009年
中国硕士学位论文全文数据库 前10条
1 陈卫;基于支持向量机的说话人识别系统研究[D];华北电力大学(河北);2005年
2 陈军;基于支持向量机的脱机手写体汉字识别方法的研究[D];合肥工业大学;2006年
3 任爽;基于XML和SVM的Web文本挖掘研究[D];大连理工大学;2006年
4 唐孝;支持向量机(SVM)及其在心电图(ECG)分类识别中的应用[D];四川师范大学;2007年
5 王晓晶;支持向量机在脑功能模式识别和分类中的研究[D];天津师范大学;2009年
6 张淼;基于支持向量机的文本分类系统研究[D];大庆石油学院;2008年
7 周辉;齿轮故障的特征提取与模式识别技术研究[D];郑州大学;2005年
8 朱丹红;数字图书馆基于内容的图像检索技术的研究[D];福州大学;2006年
9 赵智超;基于数据挖掘的沙尘暴智能预报系统的研究[D];天津大学;2005年
10 张晓飞;基于支持向量机的图像信息分类与检索[D];沈阳大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026