收藏本站
《湖南农业大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

支持向量回归机的改进及其在植物保护中的应用

谭泗桥  
【摘要】: 植物保护研究中存在大量回归建模问题。这些问题多属非线性范畴,传统方法如多元线性回归、逐步线性回归等线性方法的应用受到限制;基于经验风险最小的非线性方法如人工神经网络,虽具有较好的非线性逼近能力,但难以克服维数灾难和局部极小问题,且小样本情况下过拟合严重,预测误报风险大。统计学习理论(Statistical Learning Theory,SLT)是在研究小样本统计估计问题过程中发展起来的新兴理论,该理论的最大贡献是提出了结构风险最小化准则并基于该准则建立了支持向量机(support vector machine,SVM)方法。支持向量机包括分类(support vector classification,SVC)和回归(support vector regression,SVR)两类,它较好地解决了非线性、小样本、过拟合以及维数灾难等问题,具全局最优、泛化推广能力强等优点,已在多个领域得到广泛应用,但用于植物保护的报道较少。 本文对支持向量回归机(SVR)存在的缺陷进行改进,发展了若干新的算法,在此基础上,将其应用于植物保护中纵向数据回归(以多维时间序列分析为例)和非纵向数据回归(以农药定量构效关系建模和饲料配方优化为例)研究,主要研究内容及成果如下: (1)改进了SVR的若干缺陷。SVR的核函数选择依赖经验而缺乏理论指导;本文依均方误差(mean squared error,MSE)最小原则发展了从4种常用核函数中自动选择最优核函数的方法。在非线性体系中,以逐步线性回归等线性方法筛选自变量存在弊端;本文基于SVR发展了“多轮末尾淘汰法”,从包含全部输入描述符的SVR模型中以留一法基于MSE最小原则非线性逐次剔除对提高预测精度不利的自变量,剩下的为保留自变量。SVR的另一缺陷是不存在一个显性的表达式,可解释性差;本文基于SVR发展了“多轮末尾强制淘汰法”,可给出各保留自变量对预测精度影响程度的重要性顺序,使SVR具备了部分的解释能力。结合多因子多水平复杂配方优化问题,本文给出了SVR模型回归与偏回归显著性测验的F测验方法,进一步提升了SVR的可解释性。为在小样本前提下评估SVR模型预测可信度,本文发展了“双重留一法”,从最优函数及其保留自变量出发,规格化后再次以留一法搜索寻找最优SVR参数,并基于最优参数对样本训练后实施预测,“双重留一法”近似于独立测试。在上述改进的基础上,建立了SVR在回归分析中的应用框架。 (2)基于SVR发展组合预测方法用于农药定量构效关系建模。组合模型预测精度较单一模型更高,本文构建了两个组合预测模型。第一个模型针对样本集存在的异质性,基于SVR结合K-近邻法构建组合模型,核函数寻优和描述符筛选后再依不同近邻的子模型以双重留一法实施组合预测,从行方向(样本)和列方向(描述符)进行优化,提高了预测精度。第二个模型考虑到小样本建模困难,基于学习能力强的局部核函数和推广能力强的全局核函数构建模型,即以径向基核函数与多项式核函数为子模型构成组合样本,基于SVR实施核函数寻优与描述符筛选后以双重留一法实施预测,该方法较线性组合方法精度更高。上述两种方法分别用于不同农药的定量构效关系建模,预测精度均优于文献报道结果。 (3)基于SVR优化多因子多水平复杂配方。实施少量试验,优化配方并解释各因子效应意义重大。本文首先以文献报道的小菜蛾饲料配方优化数据为例,建立基于SVR优化配方、分析因子效应的方法学:从原始配方样本集出发,以SVR进行核函数寻优和自变量筛选后实施双重留一法预测,预测精度优于多元线性回归模型,表明非线性的SVR更适合用于优化配方。全组合预测后进行频次寻优,依各因子最优频次决定是否外推因子水平实施下一轮试验,以保证优化效果。此前对SVR模型的评价需以参比模型为参照,以MSE为指标进行比较;本文从F测验定义出发,构建了SVR回归的显著性测验方法。传统的二次多项式回归方程在依系数正负、大小解释各因子效应时,常出现一次项与二次项结果相互矛盾的情形,而一般的SVR模型又不具解释性;本文从偏回归分析定义出发,建立了基于SVR以F测验解释、评价各因子相对重要性的方法。基于SVR的单因子效应分析、双因子互作效应分析方法也一并给出。 上例是依文献报道数据进行的方法学研究,本文进一步用一个研究实例来验证新方法的有效性:结合SVR和均匀设计,对12因子5水平井冈霉素发酵培养基配方的实际优化设计表明,仅通过20个处理,表征井冈霉素含量的OD_(560)即由初始配方(生产厂家已优化配方)的1.72提高到2.22,且最终配方只保留了6个因子,对各因子效应分析合理,优化效果极为显著。 (4)基于地统计学和SVR的多维时间序列分析。多维时间序列模型既要体现环境因子的影响,又要反映样本集的动态特征,其中相空间重构等(即定阶)是一个难点。本文将地统计学和SVR相结合,构建了多维时间序列分析的GS-SVR模型:以半变异函数分析因变量的结构性,依变程来确定因变量的拓展阶数,避免拓阶陷入局部最优;考虑到历史环境因子对当前预测因变量的效应大部分已在历史因变量中体现,故历史环境因子仅拓展1阶;定阶后以SVR实施核函数寻优与非线性自变量筛选,以主成分分析减少信息冗余并降低样本维数,最后基于SVR实施一步法独立预测。小麦赤霉病发病率和二代玉米螟危害程度两个多维时间序列实例验证表明,GS-SVR预测精度明显优于参比模型。
【学位授予单位】:湖南农业大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:S4

【引证文献】
中国硕士学位论文全文数据库 前3条
1 高佳;基于支持向量机的地下矿泉水质预测研究[D];山东师范大学;2010年
2 朱钦平;基因表达谱数据特征选择算法研究[D];江苏科技大学;2011年
3 向科军;基于支持向量机的化学农药QSAR建模[D];湖南农业大学;2011年
【参考文献】
中国期刊全文数据库 前10条
1 蔡煜东,许伟杰;自组织人工神经网络在棉花烂铃病流行趋势预报中的应用[J];安徽农业科学;1994年01期
2 王杰,檀根甲,胡易冰,刘明芳;基于神经网络的稻白叶枯病中期预警[J];安徽农业大学学报;2002年01期
3 高彦宇,杨扬,陈飞;基于融合特征和LS-SVM的脱机手写体汉字识别[J];北京科技大学学报;2005年04期
4 李志雄;王志成;袁锡文;邱雪强;林军;;基于小波变换和支持向量机的中国大陆强震预测[J];地震;2006年03期
5 冯旭东,陈方;神经网络在病虫害诊断中的应用[J];电脑开发与应用;1999年01期
6 陈顺立;张华峰;张潮巨;谢峥;;神经网络在松墨天牛发生量预报中的应用[J];福建林学院学报;2006年01期
7 李剑,陈德钊,吴晓华,叶子清;优化的径向基-循环子空间网络为药物定量构效关系建模[J];分析化学;2005年06期
8 李剑;陈德钊;成忠;叶子青;;构建支持向量机-偏最小二乘法为药物构效关系建模[J];分析化学;2006年02期
9 杨光富,丁宇,杨华铮,吴小军;新型黄烷酮类衍生物的合成、杀菌活性及定量构效关系研究[J];高等学校化学学报;2004年01期
10 谭显胜;袁哲明;周铁军;王春娟;熊洁仪;;Multi-KNN-SVR组合预测在含氟化合物QSAR研究中的应用[J];高等学校化学学报;2008年01期
中国博士学位论文全文数据库 前4条
1 马儒宁;神经网络与支持向量机相关问题研究[D];复旦大学;2005年
2 梅虎;肽的定量构效关系研究[D];重庆大学;2005年
3 曾绍华;支持向量回归机算法理论研究与应用[D];重庆大学;2006年
4 任东;基于支持向量机的植物病害识别研究[D];吉林大学;2007年
中国硕士学位论文全文数据库 前1条
1 郭恺;人脸识别中基于核的方法的研究[D];山东大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 方国桢,方梅,汪敬;化学计量学在原子发射光谱分析元素形态中的应用[J];四川有色金属;1999年01期
2 魏丽萍,林景雪,马月琴;烧蚀复合材料的热分析检测[J];工程塑料应用;1991年01期
3 魏莉萍,林景雪,马月琴;用热分析技术定量检测复合材料烧蚀性能[J];工程塑料应用;1994年06期
4 谢涛,蒋泽中;边坡系统稳定性多模型综合评价[J];四川建筑科学研究;2004年02期
5 刘铮;孙俊;王冬;费维水;;施工危险源辨识结果库知识的获取研究[J];四川建筑科学研究;2006年03期
6 谢飞;;支持向量机及其应用研究[J];安徽教育学院学报;2007年03期
7 齐新安;朱祖林;;安徽电大远程开放教育专业招生规模与发展态势的灰关联分析[J];安徽广播电视大学学报;2007年03期
8 王志峰,孙小镭,曹齐卫,高俊凤,曲士松,孙晋斌;山东黄瓜地方种质资源的聚类分析[J];山东农业科学;2003年05期
9 魏鑫;王玉霞;王淑敏;董文轩;;平欧杂种榛过氧化物同工酶研究[J];山东农业科学;2008年01期
10 卢合全;李振怀;董合忠;李维江;唐薇;张冬梅;罗振;;杂交棉种植密度与留叶枝对产量及其构成因素的互作效应研究[J];山东农业科学;2009年11期
中国重要会议论文全文数据库 前10条
1 张祥明;;美盛肥料对油菜经济性状和产量的影响[A];土肥水资源高效利用与农业面源污染防控技术研讨会论文集[C];2011年
2 韩敏;李德才;;基于因果聚类的多变量时间序列相关性研究及预测[A];第二十六届中国控制会议论文集[C];2007年
3 宋海鹰;桂卫华;阳春华;;基于核偏最小二乘的简约最小二乘支持向量机及其应用研究[A];第二十六届中国控制会议论文集[C];2007年
4 周绮凤;林成德;罗林开;彭洪;;一种基于黎曼度量的训练样本类不平衡SVM分类方法研究[A];第二十六届中国控制会议论文集[C];2007年
5 顾小军;杨世锡;钱苏翔;;基于支持向量机的旋转机械多类故障识别研究[A];第二十六届中国控制会议论文集[C];2007年
6 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
7 姜明辉;袁绪川;;基于GA优化的个人信用评估SVM模型[A];第二十六届中国控制会议论文集[C];2007年
8 ;Improved Particle Swarm Optimized SVM for Short-term Traffic Flow Predication[A];第二十六届中国控制会议论文集[C];2007年
9 潘松;魏民祥;;某型航空无人飞行器用发动机模型辨识的研究[A];第二十七届中国控制会议论文集[C];2008年
10 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 母丽华;煤矿安全预警系统的方法研究[D];哈尔滨工程大学;2010年
3 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
4 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
5 朱广平;混响干扰中的信号检测技术研究[D];哈尔滨工程大学;2009年
6 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
7 冯麟涵;舰船系统抗冲击性能全局优化方法研究[D];哈尔滨工程大学;2009年
8 李晚龙;六自由度Stewart平台分散智能控制研究[D];哈尔滨工程大学;2010年
9 种培芳;荒漠植物红砂、白刺和沙拐枣抗旱指标及抗旱性综合评价研究[D];甘肃农业大学;2010年
10 杨宁;计算机辅助卷烟配方设计关键技术研究[D];中国海洋大学;2010年
中国硕士学位论文全文数据库 前10条
1 展慧;基于多源信息融合技术的板栗分级检测方法研究[D];华中农业大学;2010年
2 卢增斌;防治水稻螟虫单项技术措施的评价及储备技术—转基因水稻对非靶标生物影响的研究[D];华中农业大学;2010年
3 申君;桃蚜的抗药性监测、杀虫剂的配方筛选及其增效生化机理的研究[D];华中农业大学;2010年
4 李贝;切花月季品种综合评价筛选及其配套栽培技术研究[D];华中农业大学;2010年
5 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
6 宋家勇;安林煤矿炮放面矿压显现规律及顶煤冒放性预测研究[D];河南理工大学;2010年
7 王浩锋;基于BP神经网络的航段安全评估研究[D];中国工程物理研究院;2010年
8 代宏伟;布里渊散射水下探测目标的自动识别[D];南昌航空大学;2010年
9 朱志斌;基于金属材料的扰动磁场检测技术研究[D];南昌航空大学;2010年
10 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 张蓉,岳永德,花日茂,汤锋,曹德菊,操海群,李学德;磺酰脲类除草剂在环境中的转归和影响[J];安徽农业科学;2003年06期
2 刘春萍,戴梅,张华北;新烟碱型乙酰胆碱受体吡啶基醚类配体的3维定量构效关系[J];北京师范大学学报(自然科学版);2003年06期
3 高彦伟;董德明;陈殿友;张岩坤;韩晓华;;时域克里格方法在地表水水质预测中的应用[J];吉林大学学报(地球科学版);2008年03期
4 周生贤;;关于《中华人民共和国水污染防治法(修订草案)》的说明——2007年8月26日在第十届全国人民代表大会常务委员会第二十九次会议上[J];中华人民共和国全国人民代表大会常务委员会公报;2008年02期
5 籍国东,赵元慧,袁星;量化参数及其在定量结构-活性-性质相关研究中的应用[J];东北师大学报(自然科学版);1998年04期
6 张良杰,毛志宏,李衍达;遗传算法中突变算子的数学分析及改进策略[J];电子科学学刊;1996年06期
7 徐维维;刘洁;;浅谈灰色系统理论[J];福建电脑;2009年08期
8 喻红霞,胡建达;基因芯片的应用及其数据分析方法[J];福建医科大学学报;2005年02期
9 迟宝明;林岚;丁元芳;;基于遗传算法的BP神经网络模型在地下水动态预测中的应用研究[J];工程勘察;2008年09期
10 施枫芝;迟宝明;潘杰;;BP神经网络模型在地下水质量评价中的应用[J];工程勘察;2008年10期
中国博士学位论文全文数据库 前7条
1 孙德山;支持向量机分类与回归方法研究[D];中南大学;2004年
2 安金龙;支持向量机若干问题的研究[D];天津大学;2004年
3 徐红敏;基于支持向量机理论的水环境质量预测与评价方法研究[D];吉林大学;2007年
4 王朝勇;支持向量机若干算法研究及应用[D];吉林大学;2008年
5 彭新俊;支持向量机若干问题及应用研究[D];上海大学;2008年
6 邹淑雪;基于支持向量机的蛋白质结构域预测方法研究[D];吉林大学;2009年
7 韩顺杰;基于支持向量机的工程车辆自动变速方法研究[D];吉林大学;2009年
中国硕士学位论文全文数据库 前6条
1 张志;人工神经网络水质预测建模适应性研究[D];内蒙古农业大学;2003年
2 杨小涛;支持向量机算法研究及在基因表达数据分析中的应用[D];华中科技大学;2004年
3 边博;宁夏石嘴山市地下水水质预测及评价模型研究[D];西安理工大学;2005年
4 杭烨超;含-SO_2芳香类化合物的QSAR研究[D];南京工业大学;2006年
5 谭显胜;基于支持向量机的蛋白质分类及含氟农药活性预测[D];湖南农业大学;2007年
6 彭鑫林;新烟碱类杀虫剂的定量构效关系研究[D];湖南农业大学;2008年
【二级引证文献】
中国期刊全文数据库 前1条
1 黄鹤;卢文喜;姜雪;;支持向量机在水质评价及水位动态预测中的应用[J];中国农村水利水电;2012年09期
中国硕士学位论文全文数据库 前1条
1 梁勇;基于支持向量回归的水质预测研究[D];武汉理工大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 丁蕾,陶亮;支持向量机在胆固醇测定中的应用[J];安徽大学学报(自然科学版);2005年02期
2 张恒;马铃薯酸奶的生产工艺[J];中外技术情报;1996年04期
3 唐庆峰,吴振廷,金涛,王学林,吴尚澧;不同饲料对中华真地鳖营养效应的研究[J];安徽农业科学;2005年01期
4 韩兵,濮厚平,王蒙,杨琴;松墨天牛卵期的预测预报[J];安徽农业大学学报;2000年03期
5 李丽,孙云兰,陈雪波;一个确定铁水脱硫剂喷吹量的专家系统[J];鞍山科技大学学报;2004年02期
6 尚磊;刘风进;;基于支持向量机的手写体数字识别[J];兵工自动化;2007年03期
7 刘华富;支持向量机Mercer核的若干性质[J];北京联合大学学报(自然科学版);2005年01期
8 余新晓;降雨侵蚀力指数的时间序列分析[J];北京林业大学学报;1990年02期
9 姚晓红;林分生长数据的时序分析探讨[J];北京林业大学学报;1990年04期
10 张素芬,夏乃斌,屠泉洪;油松毛虫种群动态的ARMA(p,q)模型[J];北京林业大学学报;1992年01期
中国博士学位论文全文数据库 前2条
1 王克如;基于图像识别的作物病虫草害诊断研究[D];中国农业科学院;2005年
2 周水生;竞争学习向量量化和支持向量机的关键技术研究[D];西安电子科技大学;2005年
中国硕士学位论文全文数据库 前1条
1 孙虎;小麦全蚀病生物防治研究及品种抗性鉴定[D];河南农业大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 赵云升;害虫种群动态的组合预测[J];昆虫知识;1991年03期
2 陈秉钧,上官儒;基于人工神经网络的组合预测及应用[J];农业工程学报;1997年02期
3 戚佩珊;组合预测方法探讨[J];安徽技术师范学院学报;1991年02期
4 吴春霞,何勇,蔡建平;组合预测方法及其在粮食产量预测中的应用[J];农业系统科学与综合研究;2002年01期
5 李中才,黄晓东,刘冬梅;黑龙江省农机总动力的组合预测研究[J];农机化研究;2002年02期
6 陈晓虎;确定组合预测和变权重组合预测权重的一种确定性方法[J];农业系统科学与综合研究;1996年04期
7 吴玉鸣;中国农业因子分析神经网络组合预测研究[J];农村经济;2003年03期
8 张海云,刘桂兰,何勇;组合预测方法及其在粮食产量预测中的应用[J];农机化研究;2002年04期
9 袁泉,何勇;组合预测方法在浙江省粮食产量预测中的应用[J];农业系统科学与综合研究;1996年04期
10 徐梅,刘振忠;组合预测方法及其在土壤水分预测中的应用[J];黑龙江八一农垦大学学报;1998年01期
中国重要会议论文全文数据库 前10条
1 牛东晓;李金超;李金颖;刘达;;基于遗传算法的中长期电力负荷组合预测[A];第二十六届中国控制会议论文集[C];2007年
2 田瑾;项静恬;陈殿斌;;多种时间序列建模及组合预测的比较和改进[A];中国现场统计研究会第九届学术年会论文集[C];1999年
3 唐小我;;组合预测误差信息矩阵研究[A];全国青年管理科学与系统科学论文集(第2卷)[C];1993年
4 杨辉煌;;P次幂非线性组合预测方法研究[A];1998中国控制与决策学术年会论文集[C];1998年
5 龙如银;;矿井深部相对瓦斯涌出量的预测研究[A];管理科学与系统科学进展——全国青年管理科学与系统科学论文集(第4卷)[C];1997年
6 卫贵武;姚恒申;;用改进的模糊AR(p)与指数平滑组合模型预测油田产油量[A];第12届全国模糊系统与模糊数学学术年会论文集[C];2004年
7 倪立峰;韩晓林;;基于量化、非量化信息的单桩极限承载力预测新探索[A];第九届全国结构工程学术会议论文集第Ⅲ卷[C];2000年
8 杨宏涛;汪波;;组合预测法在我国填料产业市场研究中的应用[A];全国青年管理科学与系统科学论文集第5卷[C];1999年
9 吴昊;;智能预测支持系统IFSS的建立[A];1993中国控制与决策学术年会论文集[C];1993年
10 梁仕莹;孙东升;杨秀平;刘合光;;2008—2020年我国粮食产量的预测分析[A];纪念农村改革开放30周年学术研讨会暨建所50周年庆典论文集[C];2008年
中国重要报纸全文数据库 前5条
1 中国人民大学 胡乃武 教授 美国加州大学 龙向东 博士;诺贝尔经济学奖得主 恩格尔、格兰杰贡献及理论[N];金融时报;2003年
2 本报记者 尹晓华 实习生 张文博;开拓者唐小我[N];四川日报;2003年
3 龚国军;华夏证券为价值研究注入“强心剂”[N];中华工商时报;2004年
4 方尚;抓住“后危机”时代的应变之道[N];中国纺织报;2009年
5 记者 王淼 通讯员 修孟懿;大规模风电功率预测项目通过验收[N];国家电网报;2011年
中国博士学位论文全文数据库 前10条
1 蒋传进;基于模型遴选规则的自适应组合预测研究[D];东华大学;2014年
2 陆宁;基于群集智能与算法融合的电力负荷组合预测[D];华中科技大学;2010年
3 任海军;基于智能计算的配电网负荷预测方法研究[D];重庆大学;2010年
4 邓志茹;我国能源供求预测研究[D];哈尔滨工程大学;2011年
5 丰小月;基于量子机制与组合方法的智能优化算法及应用研究[D];吉林大学;2008年
6 万玉成;基于未确知性的预测与决策方法及其应用研究[D];东南大学;2004年
7 张磊;中国石油安全分析与对策研究[D];天津大学;2007年
8 廖瑞金;变压器绝缘故障诊断黑板型专家系统和基于遗传算法的故障预测研究[D];重庆大学;2003年
9 陈玲;风电场风速和风功率预测方法研究[D];武汉大学;2012年
10 张道军;复杂水环境资源系统智能管理、预测和决策的研究[D];大连理工大学;2002年
中国硕士学位论文全文数据库 前10条
1 于媛媛;基于组合预测的核电产业发展趋势研究[D];大连理工大学;2010年
2 陈宝;基于最大似然的贝叶斯模型平均组合预测及其在煤炭需求预测中的应用[D];重庆师范大学;2011年
3 胡平;降雨径流组合预测理论及其应用研究[D];华中科技大学;2004年
4 钱振松;小波网络及组合预测在赤潮灾害智能预警系统中的应用研究[D];山东大学;2010年
5 王白玲;电力负荷组合预测的理论方法及影响因素分析[D];华北电力大学(北京);2005年
6 王红丽;基于状态转移的股指期货波动时变组合预测研究[D];重庆师范大学;2011年
7 王小忠;物流量预测方法研究[D];武汉理工大学;2005年
8 朱报春;基于模糊逻辑系统的组合预测方法及应用[D];河海大学;2001年
9 周仲礼;中国油气资源需求分析[D];成都理工大学;2004年
10 李春生;模糊变权重组合预测方法的研究[D];中南大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026