收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

支持向量机及其在生物材料功能研究中的应用

蔡从中  
【摘要】:蛋白质结构分析的经典方法是x射线晶体学和多维核磁共振技术。这些技术昂贵、费时,甚至有些蛋白质根本无法用这些方法测出结构;而另一方面,蛋白质测序则显得相对简单、快捷和廉价。因此导致已知序列的蛋白质数量与已知结构的蛋白质数量的差距变得越来越大,迫使人们应用多种模拟技术对蛋白质的结构进行了广泛、深入的研究。经过近30年的研究和发展,蛋白质结构预测的准确率仍然只维持在65%~85%之间。在人类已进入后基因时代的今天,许多未知功能的蛋白质急需进行研究。如何根据蛋白质的结构或仅从序列信息出发来预测蛋白质的功能成为了一个迫切需要解决的问题。以往人们对于蛋白质功能预测主要集中在对于单个或某些特定蛋白质功能的预测上,难以满足生命科学发展的需要。如果从序列决定结构、结构决定功能这条思路出发,先以序列预测结构,再据此预测/推定功能的方式来预测蛋白质的功能,受目前蛋白质结构预测准确率偏低的影响,其准确率无疑又将大打折扣。根据蛋白质结构、功能的预测研究的现状,本文提出从组成蛋白质的氨基酸的物理、化学性质出发,应用机器学习方法—支持向量机(Support Vector Machine, SVM),直接基于蛋白质序列大规模地预测蛋白质的功能。 本文利用随机梯度上升算法构建了一套通用二类分类器-SVM★。应用声纳数据集及多组蛋白质分类数据集,将SVM★与基于SMO(Sequential Minimal Optimization)算法的SVMlight和基于QP(Quadratic Programming)算法的SVM-QP同类软件进行了比较研究,结果表明:SVM★的分类性能均优于SVMlight和SVM-QP。 创建了简洁、实用的网上在线通用二类分类软件SVM★网站和网上在线蛋白质功能预测服务软件SVMProt。 首次应用支持向量机算法系统地研究了大量的功能蛋白质家簇的分类问题。对包括酶蛋白在内的69个蛋白质功能家簇进行了样本采集和基于序列的分类研究。经过对完全独立评价样本集的测试及测试结果置信度的统计表明:SVMProt具有很强的蛋白质功能识别本领,其识别准确率在80.5%~99.7%之间。进一步深入研究发现,SVMProt还突破了基于序列比对的蛋白质分类的瓶颈问题,它可以在一定程度上预测具有不同功能的同源蛋白质的功能及具有相同功能的远缘蛋白质的功能。 WP=6 应用SVMProt对SARS冠状病毒的3个蛋白质(E protein, N protein和ORF13)进行了预测,结果显示:E protein是一种能与膜蛋白结合的蛋白质,N protein是一种能与RNA结合在一起的蛋白质,两结果与实际事实完全吻合。SVMProt将未知功能的ORF13预测为一种可能结合到DNA上的核蛋白并兼有病毒体内结构蛋白质的功能,这一结果对治疗SARS疾病的药物研制工作人员具有一定的理论指导作用。 基于草药的性味归经,应用SVM★对传统中药组方进行了分类和识别研究,由此所发现的假阳性样本配方有提供给执业中医师做进一步药理分析和研究的价值。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 朱国强,刘士荣,俞金寿;支持向量机及其在函数逼近中的应用[J];华东理工大学学报;2002年05期
2 贾存良;吴海山;巩敦卫;;煤炭需求量预测的支持向量机模型[J];中国矿业大学学报;2007年01期
3 张红亮;王水林;吕颖慧;尹小涛;;爆破震动效应的支持向量机分析预测[J];矿业研究与开发;2007年04期
4 张国新;汤青波;许德昌;;基于支持向量机的液压泵故障诊断[J];煤矿机械;2007年08期
5 冯剑丰;王洪礼;李胜朋;;基于支持向量机的浮游植物密度预测研究[J];海洋环境科学;2007年05期
6 辛玉红;朱广田;;基于支持向量机的ERP软件供应商选择[J];辽宁工程技术大学学报;2007年S2期
7 邹华胜;杨峰;李刚;;基于支持向量机的路基检测研究[J];矿业研究与开发;2008年02期
8 张金牡;;基于支持向量机的水利工程项目风险评价[J];西部探矿工程;2008年06期
9 景海河;叶欣;高彦东;;基于支持向量机的矿区开采沉降的预测[J];黑龙江科技学院学报;2008年04期
10 刘德地;陈晓宏;;基于支持向量机的洪水灾情综合评价模型[J];长江流域资源与环境;2008年03期
11 刘解放;高普梅;侯振雨;;连续小波变换-支持向量回归模型及其在谷物近红外光谱分析中的应用(英文)[J];东莞理工学院学报;2008年05期
12 王君;刘道杰;;基于支持向量机的稳健单井成本估计[J];国外油田工程;2009年09期
13 李言德;刘飞;;基于支持向量机的精馏塔模糊预测控制算法研究[J];广州化工;2009年06期
14 陈祖云;张桂珍;邬长福;杨胜强;;支持向量机在岩爆预测中的应用[J];金属矿山;2009年11期
15 申俊琦;胡绳荪;冯胜强;高忠林;;基于支持向量机的焊缝尺寸预测[J];焊接学报;2010年02期
16 刘北战;梁冰;;基于SVM降雨充水矿井涌水量预测[J];辽宁工程技术大学学报(自然科学版);2010年S1期
17 刘爱华;傅雪海;王可新;彭伦;周宝艳;;支持向量机预测煤层含气量[J];西安科技大学学报;2010年03期
18 魏好;邓喀中;卢正;范洪冬;;基于支持向量机的主要影响角正切求取方法研究[J];金属矿山;2010年05期
19 聂玲玲;童凯军;侯东梅;韩雪芳;王刚;周凤军;;利用支持向量机方法求取缝洞型油气藏地层系数[J];中国海上油气;2011年02期
20 王冉;杨道军;;基于支持向量机的巢湖富营养化程度评价研究[J];环境科学与管理;2011年05期
中国重要会议论文全文数据库 前10条
1 林杰华;张斌;李冬森;宋华茂;余志强;王浩;;支持向量机在电力客户信用评级中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
2 蒋铁军;张怀强;李积源;;多变量系统预测的支持向量机方法研究[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年
3 黄淑云;孙兴玉;梁汝萍;邱建丁;;基于小波支持向量机预测蛋白质亚细胞定位研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
4 谢湘;匡镜明;;支持向量机在语音识别中的应用研究[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
5 涂冬成;薛龙;刘木华;赵进辉;沈杰;吁芳;;基于支持向量机的鹅肉肉色客观评定研究[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年
6 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
7 师旭超;巴松涛;;基于支持向量机方法的深基坑变形预测[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(上册)[C];2004年
8 张军;;支持向量机方法在地下水位干扰排除中的初步应用[A];2007年地震流体学术研讨会论文摘要集[C];2007年
9 许建生;盛立东;;基于改进的支持向量机和BP神经网络的识别算法[A];第八届全国汉字识别学术会议论文集[C];2002年
10 荣海娜;张葛祥;张翠芳;;基于支持向量机的非线性系统辨识方法[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 刘叶青;原始空间中支持向量机若干问题的研究[D];西安电子科技大学;2009年
2 常甜甜;支持向量机学习算法若干问题的研究[D];西安电子科技大学;2010年
3 胡运红;支持向量机的若干算法研究[D];山东科技大学;2011年
4 周喜川;非可信环境下的支持向量机研究[D];浙江大学;2010年
5 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
6 杜小芳;基于CPFR的农产品采购模型研究[D];华中科技大学;2005年
7 刘育明;动态过程数据的多变量统计监控方法研究[D];浙江大学;2006年
8 栾锋;支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究[D];兰州大学;2006年
9 孙薇;市场条件下抽水蓄能电站效益综合评价及运营模式研究[D];华北电力大学(河北);2007年
10 常群;支持向量机的核方法及其模型选择[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 刘艳伟;支持向量机方法在感潮河段洪峰水位预报中的应用[D];浙江大学;2010年
2 杨镭;支持向量机算法设计及在高分辨雷达目标识别中的应用[D];国防科学技术大学;2010年
3 童振;基于支持向量机的电解液成分预测[D];东北大学;2008年
4 聂小芳;模糊粗糙集与支持向量机在煤与瓦斯突出预测中的应用研究[D];辽宁工程技术大学;2009年
5 鄢常亮;基于支持向量机的高炉向凉向热炉况预测研究[D];内蒙古科技大学;2010年
6 韩叙东;基于支持向量机的水电故障分类器的设计与实现[D];东北大学;2008年
7 冯杰;慢时变对象的支持向量机建模与在线校正方法研究[D];东北大学;2009年
8 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
9 王奇安;基于广泛内核的CVM算法研究及参数C的选择[D];南京航空航天大学;2009年
10 张永新;基于支持向量机和遗传算法相结合的模拟电路故障诊断方法研究[D];东北大学;2009年
中国重要报纸全文数据库 前10条
1 课题主持人 李心丹 课题协调人 上海证券交易所 施东晖 傅浩 课题研究员 宋素荣 查晓磊 宾红辉 张许宏 郭静静 黄隽 南京大学工程管理学院;内幕交易与市场操纵的行为动机与判别监管研究[N];中国证券报;2007年
2 李水根;计算机详解配伍与药效关系[N];健康报;2005年
3 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
4 YMG记者 李仁 通讯员 曲华明 孙运智;我市九项目进入省“盘子”[N];烟台日报;2010年
5 上海大学理学院教授、副院长 陆文聪;酷爱化学 孜孜以求[N];中国化工报;2006年
6 ;选择合适的数据挖掘算法[N];计算机世界;2007年
7 周颖;王米渠与中医心理学[N];中国中医药报;2006年
8 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
9 记者 张云普通讯员 全攀峰 安强强;大庆物探深度域地震资料岩性解释技术获得五大突破[N];中国石油报;2008年
10 本报记者 冯治恩;敢与“雷公”试比高[N];铜川日报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978