收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于特征提取的酶识别问题研究

魏继翔  
【摘要】:在生物信息学中,将酶从蛋白质识别出来一直是对酶进行进一步研究的一个前提。其研究方法都是将已知的酶作为研究对象,找出一种对已知酶进行准确识别的方法,然后推广到对未知酶识别的应用中。传统的酶识别方法多是采用序列比对的方法,虽然后人对这种方法有不断地改进,但是仍需要较大的存储空间与比对时间。近些年,机器学习的方法也开始的应用到这个领域中。支持向量机(Support Vector Machine, SVM)——一种基于统计学理论的机器学习方法,借助自己的无局部最小点和防止过适应等优点,迅速成为研究的热点并且在酶识别领域表现出不错的效果。 为了得到好的机器学习效果,机器学习需要研究者根据实际问题的不同提出一套完整的机器学习方案。本文以支持向量机为基础,采用了一种基于特征提取的机器学习方案,通过选取合适数量的特征作为训练数据形成分类精度最高的酶识别器。之所以选用特征提取的方法主要是因为:在实验中,蛋白质的功能域被看做它的特征,并不是所有的功能域都对形成准确的分类器起到好的作用,并且我们推测这些功能域特征中存在噪声,因此应该剔除其中一些起到反作用的特征。 基于以上的原因,文中选用了1-rule法和信息增益法两种特征提取的方法,并且根据提取出来的特征信息的重要性大小进行排序,然后按照排序后的顺序选取不同数目的特征进行实验。为了使实验结果更具说服力,文中采取了自检法和留一法两种不同的误差率的评估方法,可以更全面的同其它方法的结果进行比较。最后通过对实验结果的观察与分析,这两种特征提取方法形成的分类器,在对酶与非酶蛋白质识别精度上都要比原有方法的精度更高。 本文选取支持向量机为机器学习的工具,比原有的序列比对算法在计算速度上有了很大提高,并且采用了合适的特征提取的方法,对机器学习方案做了进一步的改进,使得机器学习的效果更明显,形成了一个对酶有着更高识别率的分类器。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孟国强;基于车辆牌照识别系统字符的特征提取方法研究[J];河南科学;2003年06期
2 张晓东,陈锋;基于非线性回归的自适应特征提取算法[J];阜阳师范学院学报(自然科学版);2004年02期
3 杜峰,施文康,邓勇;证据特征提取及其在证据理论改进中的应用[J];上海交通大学学报;2004年S1期
4 史玉峰,靳奉祥;高维数据有效特征的提取方法及其在测绘信息模式识别中的应用[J];有色金属;2004年04期
5 陈宇萍;外观设计专利图像检索系统研究[J];科技管理研究;2005年04期
6 胡伟文,苑秉成,刘千里,姜礼平;目标信号特征提取中的特征压缩及其算法研究[J];武汉理工大学学报(交通科学与工程版);2005年04期
7 刘丽华;自动人脸识别方法研究与展望[J];内江科技;2005年05期
8 刘丽华;人脸识别方法综述[J];云南师范大学学报(自然科学版);2005年06期
9 薛少娟;左万利;赫枫龄;;基于颜色分块全局直方图的图像检索方法及系统实现[J];吉林大学学报(理学版);2006年04期
10 翟俊海;张素芳;王熙照;;基于小波变换和支持向量机的图像分类[J];河北大学学报(自然科学版);2007年03期
11 官云兰;张红军;刘向美;;点特征提取算法探讨[J];东华理工学院学报;2007年01期
12 禄丰年;;多源遥感影像配准技术分析[J];测绘科学技术学报;2007年04期
13 闫立梅;焦德杰;;一种改进的特征提取模型及其算法[J];德州学院学报;2007年04期
14 李童;罗代升;王正勇;;遗传优化神经网络实现的人民币号码识别系统[J];四川大学学报(自然科学版);2007年04期
15 夏国恩;;基于核主成分分析特征提取的客户流失预测[J];计算机应用;2008年01期
16 孙青;刘智勇;;基于朴素贝叶斯分类模型的车型识别方法[J];五邑大学学报(自然科学版);2008年03期
17 王旭;张达敏;周勇;;基于小波变换的数字调制信号特征提取[J];贵州科学;2008年04期
18 关腾;许娜;;金融时间序列的多重分形分类[J];郑州大学学报(理学版);2008年04期
19 于春梅;潘泉;程咏梅;张洪才;;基于核主元提取的支持向量机辨识[J];数学的实践与认识;2009年01期
20 唐葆君;邱菀华;;企业危机预警熵模型设计及应用[J];系统工程理论与实践;2009年04期
中国重要会议论文全文数据库 前10条
1 林土胜;赖声礼;;视网膜血管特征提取的拆支跟踪法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
2 钱小聪;郑宝玉;穆明鑫;;神经网络联机手写签名验证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
3 张羽;汪源源;王威琪;余建国;林继耕;;狭窄血管多普勒信号特征提取的实验研究[A];21世纪医学工程学术研讨会论文摘要汇编[C];2001年
4 柳林霞;陈杰;窦丽华;;不变矩理论及其在目标识别中的应用[A];2002中国控制与决策学术年会论文集[C];2002年
5 杨日杰;施建礼;林洪文;;一种雷达视频回波特征提取方法研究[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
6 代克杰;张红梅;盛赛斌;;基于BP网络的故障特征提取方法研究[A];2004中国控制与决策学术年会论文集[C];2004年
7 何新;史迎春;周献中;;一种基于独立分量分析的音频分类方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
8 朱晓霞;孙同景;陈桂友;;基于支持向量机理论的两级指纹分类实现方法[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
9 范海宁;郭英;吴剑锋;陈志武;;基于小波包分解的声信号特征提取方法[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
10 郗长青;郑建明;李言;罗杰;;基于小波包分解的钻头磨损特征提取[A];制造技术自动化学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 冯坤;基于内积变换的机械故障特征提取原理与早期识别方法研究[D];北京化工大学;2012年
2 杨昂;生物数据特征提取方法及应用研究[D];湖南大学;2012年
3 蒋永华;旋转机械非平稳信号微弱特征提取方法研究[D];重庆大学;2010年
4 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
5 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
6 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
7 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
8 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
9 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
10 孙真真;基于光学区雷达目标二维像的目标散射特征提取的理论及方法研究[D];中国人民解放军国防科学技术大学;2001年
中国硕士学位论文全文数据库 前10条
1 曾红梅;情绪图片视觉诱发EEG特征提取与分析[D];天津大学;2012年
2 雷自力;基于Pro/E的三维零件参数化建模和特征提取研究[D];华中科技大学;2011年
3 林少波;中文文本分类特征提取方法的研究与实现[D];重庆大学;2011年
4 黄健;履带式车辆微多普勒效应与特征提取[D];国防科学技术大学;2009年
5 赵蕾蕾;基于词和基本短语模式的特征提取方法[D];河北大学;2009年
6 栾岚;基于机理模型判据的图像中微弱特征提取方法研究及应用[D];东北大学;2009年
7 王菲;面向肺部CAD的特征提取、选择及分类方法研究[D];东北大学;2009年
8 郑睿;藻类细胞图像的特征提取与分类方法研究[D];杭州电子科技大学;2009年
9 李仁杰;高分辨率SAR图像目标三维特征提取与建模[D];国防科学技术大学;2010年
10 陈日晖;面向肺部CAD的三维ROI分割、特征提取与分类方法研究[D];东北大学;2009年
中国重要报纸全文数据库 前10条
1 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
2 沈占锋;遥感影像信息提取与分析[N];计算机世界;2006年
3 王竣;深入开发CAD系统对疾病诊断有重要意义[N];中国医药报;2007年
4 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
5 上海 高博;让电脑“听懂”人话[N];电脑报;2008年
6 记者 何腾江 通讯员 周汇成;验钞新技术通过鉴定[N];中山日报;2008年
7 孙哲南 谭铁牛;生物识别的十大关键技术[N];计算机世界;2007年
8 本报记者 刘洪宇;当机器听懂了我们的声音[N];辽宁日报;2008年
9 林木树;反垃圾邮件有待新突破[N];人民邮电;2004年
10 中科院自动化所 何鹏 陶建华 谭铁牛;看懂人的“脸色”[N];计算机世界;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978