收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于支持向量机的时间序列组合预测模型

向昌盛  
【摘要】:自然科学、社会科学等领域积累了大量的时间序列数据特别是多维时间序列数据,往往既受多个环境因子的影响(需采用回归分析),又自身隐含动态时序特征(需采用自相关分析),同时呈非线性(需采用非线性分析)。预测是认识和决策的依据,发展高精度的时间序列特别是多维时间序列非线性预测分析方法意义重大。当前时间序列分析方法主要沿经典时间序列分析和相空间重构两个方向发展。 本文第一部分沿经典时间序列分析方向深入。 经典时间序列分析的关键环节为:拓阶、定阶、变量筛选、回归模型选择,前三个环节实际上常与回归模型选择耦联在一起。早期经典的多维时间序列分析模型,如带控项的自回归滑动平均模型(Controlled Autoregressive Integrating Moving Average, CARMA)及其简化模型—带控项的自回归模型(Controlled Autoregressive, CAR)均属线性模型,因而其实际预测能力较弱。基于经验风险最小的人工神经网络如前馈神经网络(Back-propagation Neural Networks, BPNN)具有较好的非线性逼近能力,但存在易陷入局部最小、可解释性差、带有较强的经验性等缺陷。基于结构风险最小的支持向量机(Support Vector Machine, SVM)以统计学习理论为基础,较好地解决了局部最小、过学习、非线性等难题,泛化能力优异,因此,本文回归模型选用SVM作为基本建模工具。 1、SLR-LSSVM组合预测模型。 利用逐步线性回归(Stepwise Linear Regression, SLR)对因子进行线性筛选,获得保留因子后用最小二乘支持向量机(Least Squares Support Vector Machine, LSSVM)进行非线性建模预测,即为SLR-LSSVM多维时间序列组合预测模型。二代玉米螟百株幼虫虫量与8个气象因子关系的拟合与独立预测表明,SLR-LSSVM优于SLR-MLR、SLR-BPNN、MLR、BPNN、LSSVM等参比模型,说明因子筛选、基于结构风险最小的SVM非线性建模有助于提高预测精度。 2、CAR-LSSVM组合预测模型 SLR-LSSVM仅考虑了环境因子的影响,未考虑自身隐含的动态时序特征(未拓阶),且其变量筛选基于SLR是线性的。CAR虽同时考虑了环境因子影响与自身动态时序特征,但其拓阶、定阶是线性的(基于MLR),变量筛选也是线性的(基于SLR)。借用CAR的思想,本文发展了非线性的CAR-LSSVM多维时间序列组合预测模型:先基于LSSVM以均方误差(Mean Squared Error, MSE)最小原则实施模型非线性拓阶、非线性定阶,再基于LSSVM对定阶后自变量进行非线性筛选获得保留自变量,最后基于LSSVM以保留自变量建模预测。大豆食心虫虫食率与5个影响因子关系的独立预测表明,CAR-LSSVM预测性能明显优于MLR、SNR(基于LSSVM的非线性逐步回归模型)、LSSVM、SLR-LSSVM、CAR等参比模型,说明非线性地统一考虑环境因子影响与自身时序特征、非线性定阶与非线性筛选变量是必要的。 3. GS-LSSVM组合预测模型 CAR基于F测验线性定阶和CAR-LSSVM基于MSE最小原则非线性定阶的共同缺陷包括:一是由低阶到高阶逐步拓阶,过程繁琐。二是因变量连带自变量同时拓阶,既易造成信息冗余、变量筛选时间增加,又易造成拓阶提前终止,降低模型预测精度。本文基于地统计学(Geostatistics, GS)与LSSVM,建立了一种快速定阶、既反映样本集动态特征又体现环境因子影响的高精度非线性时间序列组合预测模型GS-LSSVM:先基于地统计学后效时间长度进行因变量快速、充分拓阶、定阶;然后采用主成分分析消除自变量之间的信息冗余;最后以一步预测法检验GS-LSSVM的有效性。小样本松毛虫发生面积一维时间序列实例独立预测表明,GS-LSSVM模型明显优于LSSVM、GS-BPNN等参比模型。晚稻第五代褐飞虱发生量与4个气象因子的多维时间序列实例独立预测表明,GS-LSSVM预测精度高于GS-BPNN等参比模型,且稳定性最好,定阶快速准确。GS-LSSVM既反映样本集动态特征又体现环境因子影响,并避免过拟合、避免局部最小缺陷,具有非线性、泛化能力优异等优点,在时间序列预测领域有较广泛的应用前景。 4、ARIMA-DSVM组合预测模型 随着时间的推移,训练样本将越来越大,LSSVM占用的训练时间相当长,更为重要的是,对给定的某一步预测,此前历史所有样本均参与训练不一定合适,且每一个样本对预测结果的影响不一样,动态s-SVM (Dynamic s-insensitive Cost Function Support Vector Machine, DSVM)根据“近大远小”的原理,依时间动态调整不敏感损失函数参数(ε)值,保证了距离预测点时间越近的数据对预测结果影响越大,距离预测点时间越远的数据对预测结果影响则越小。差分自回归滑动平均模型(Autoregressive Integrating Moving Average, ARIMA)线性预测能力优异。当研究体系是线性或非线性未知时,本文综合线性ARIMA与动态非线性DSVM发展了ARIMA-DSVM组合预测模型:首先采用ARIMA提取、预测时间序列中的线性组分,然后采用DSVM对ARIMA预测残差进行非线性动态修正。松毛虫发生面积一维时间序列实例独立预测表明,ARIMA-DSVM模型优于ARIMA、DSVM等参比模型。 本文第二部分沿相空间重构方向深入。 基于相空间重构与LSSVM的时间序列预测包括两个关键环节:相空间重构中时间延迟τ和嵌入维m的确定、LSSVM模型王则化参数γ和核函数宽度参数σ的确定。以往研究中,相空间重构(确定τ和m)与LSSVM建模预测(确定γ和σ)是分步进行的,通过相空间重构确定的τ和m并不总能保证LSSVM有最优的预测精度。因此,不基于任何先验知识、纯粹从数据驱动实施τ和m以及LSSVM参数的联合优化是颇具吸引力的选择。然而,多因素多水平的遍历搜索优化极为耗时。 5、GA-LSSVM组合预测模型 多因素多水平的遍历搜索寻优极为耗时,而遗传算法(Genetic Algorithm, GA)是一种启发式、快速、并行搜索算法。本文发展的GA-LSSVM组合预测模型以LSSVM为基本建模工具,以GA实现τ、m、γ和σ的联合优化。对Mackey-Glass、加噪Mackey-Glass等一维时间序列实例的独立预测表明,GA-LSSVM稳定有效。 6、UD-LSSVM组合预测模型 GA是一种启发式算法,易陷入局部最优。均匀设计(Uniform Design, UD)在实验范围内选择具有低偏差趋于均匀分布的好格子点集来安排试验点,可大幅度降低实验次数到允许范围。LSSVM基于结构风险最小,较好地解决了局部最小、非线性等问题,泛化能力优异。本文针对相空间重构的延迟时间、嵌入维、LSSVM参数联合寻优问题,结合均匀设计与自调用LSSVM发展了组合预测模型UD-LSSVM,并对Mackey-Glass、Lorenz、年太阳黑子数等时间序列实例进行了仿真预测,结果表明UD-LSSVM计算复杂度低、预测精度高且优于文献报道,是一种基于数据驱动、快速有效的延迟时间-嵌入维-支持向量机参数联合优合的组合预测模型。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 朱晓曦;张潜;;基于Shapley值的组合预测方法在福建省农业总产值预测中的应用[J];安徽农业科学;2010年09期
2 王大承,贺树云;回归-时序(R-T)组合预测模型及其在耕整机发展预测上的应用[J];农业工程学报;1990年04期
3 常彭阳;;姜瘟田间分布型的研究及其应用[J];江西植保;1992年03期
4 郑洪初;;安康地区粮食产量预报模型研究[J];陕西农业科学;1993年06期
5 姜会飞;温德永;廖树华;李树岩;吴文良;;运用混沌理论预测粮食产量[J];中国农业大学学报;2006年01期
6 徐创文;陈花玲;刘彦国;高瑞春;;铣削刀具不同磨损期振动信号的分维特征[J];农业机械学报;2007年06期
7 赵璐;蔡焕杰;王健;;榆林市参考作物蒸发蒸腾量随时间序列变化的规律[J];干旱地区农业研究;2010年01期
8 彭杰彪;钟荣华;;浅析洞庭湖区50年气候变化特征[J];安徽农学通报(下半月刊);2010年12期
9 许晓艳;;基于时间序列的浑河流域降水量预测模型[J];水土保持应用技术;2011年01期
10 黄芳;金炳华;孙达;姜培坤;庄舜尧;曹志洪;;集约经营雷竹林序列的土壤磷素含量与组分[J];土壤学报;2011年02期
11 朱晓华,杨秀春;水旱灾害时间序列的分形研究方法[J];安徽农业科学;2000年01期
12 王治中,刘秀菊,李伟明,林永增;黄河流域棉花品种主要性状时间序列的变化趋势分析[J];棉花学报;2004年06期
13 彭立;苏春江;徐云;满正闯;;径流丰枯时间序列的分形特征及R/S分析[J];安徽农业科学;2007年01期
14 吴德会;虞耀君;;基于LS-SVM的小水电站年发电量智能预测模型[J];中国农村水利水电;2007年02期
15 孙春薇;王旭磊;辛永训;吴春妹;;几种关于时间序列季节调整方法的研究[J];青岛农业大学学报(自然科学版);2007年02期
16 钱峻屏;黎夏;艾彬;叶嘉安;陈晓越;刘凯;卓丽;;时间序列案例推理检测土地利用短期快速变化[J];自然资源学报;2007年05期
17 张汉坤;高阔;;江西农村经济转型的因素分析[J];安徽农业科学;2008年09期
18 刘志红;Ti m R.McVicar;Tom G.Van Nie;杨勤科;李锐;穆兴民;;基于ANUSPLIN的时间序列气象要素空间插值[J];西北农林科技大学学报(自然科学版);2008年10期
19 夏新涛;贾晨辉;王中宇;;滚动轴承摩擦力矩的非线性特征[J];农业机械学报;2009年04期
20 鞠金艳;王金武;;黑龙江省农业机械化作业水平预测方法[J];农业工程学报;2009年05期
中国重要会议论文全文数据库 前10条
1 李世平;孙浚清;;仪器精度组合预测方法研究[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅲ)[C];2008年
2 单秀生;陈华友;王宇;姚梦杰;;基于最大误差绝对值最小化的多目标区间型组合预测模型[A];第九届中国不确定系统年会、第五届中国智能计算大会、第十三届中国青年信息与管理学者大会论文集[C];2011年
3 马永开;唐小我;;组合预测模型研究[A];管理科学与系统科学进展——全国青年管理科学与系统科学论文集(第4卷)[C];1997年
4 吴炎;杜栋;;改进BP神经网络及其对江苏省粮食产量的仿真预测[A];决策科学与评价——中国系统工程学会决策科学专业委员会第八届学术年会论文集[C];2009年
5 张玉峰;贾成刚;张文喜;;应用时间序列评估人工增雨效果[A];推进气象科技创新加快气象事业发展——中国气象学会2004年年会论文集(下册)[C];2004年
6 王永忠;曾昭磐;;混沌时间序列点预测方法研究[A];1999中国控制与决策学术年会论文集[C];1999年
7 王波;张斌;;一种基于云模型的时间序列特征表示方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
8 郭景峰;代军丽;马鑫;王娟;;针对通信社会网络的时间序列链接预测算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
9 王有良;周文国;;基于时间序列的基坑水平变形预测模型[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年
10 王玉涛;程国辉;周建常;王师;;神经网络在高炉铁水硅含量预报中的应用[A];1998中国控制与决策学术年会论文集[C];1998年
中国博士学位论文全文数据库 前10条
1 向昌盛;基于支持向量机的时间序列组合预测模型[D];湖南农业大学;2011年
2 杨正瓴;时间序列中的混沌判定、预报及其在电力系统中的应用[D];天津大学;2003年
3 张晓伟;水文动力系统自记忆特性及其应用研究[D];西安理工大学;2009年
4 倪丽萍;基于分形技术的金融数据分析方法研究[D];合肥工业大学;2010年
5 刘大同;基于Online SVR的在线时间序列预测方法及其应用研究[D];哈尔滨工业大学;2010年
6 张永林;车辆道路数值模拟与仿真研究[D];华中科技大学;2010年
7 崔亚强;沪深300股指内在复杂性分析及预测研究[D];天津大学;2010年
8 杨谈;网络混沌行为及其控制的研究[D];北京邮电大学;2009年
9 李星毅;基于相似性的交通流分析方法[D];北京交通大学;2010年
10 胡予红;煤炭消费预测与温室气体减排途径和对策研究[D];中国矿业大学(北京);2010年
中国硕士学位论文全文数据库 前10条
1 陈金翠;最小二乘支持向量回归组合预测模型的应用[D];新疆大学;2010年
2 王聚杰;基于小波去噪的组合预测模型及其在短期电力负荷预测中的应用[D];兰州大学;2011年
3 叶鸿;我国航运企业物流战略联盟研究[D];河海大学;2004年
4 姚萌;网络流量组合预测模型的研究[D];江南大学;2008年
5 张家樾;组合预测方法在汇率预测中的应用研究[D];厦门大学;2008年
6 李明理;高速公路交通量生成机理与预测方法研究[D];大连理工大学;2010年
7 王菲菲;组合预测方法及区域出口贸易预测研究[D];湖南大学;2007年
8 甘霖;组合预测模型在中长期电力负荷预测中的应用[D];南昌航空大学;2012年
9 曹建华;基于灰色神经网络模型的网络流量预测算法研究[D];江南大学;2008年
10 平平;组合预测模型在吉林省生猪价格预测中的应用[D];吉林大学;2010年
中国重要报纸全文数据库 前10条
1 ;《时间序列与金融数据分析》[N];中国信息报;2004年
2 东证期货 王爱华 杨卫东;两年涨跌轮回 秋季普遍下跌[N];期货日报;2009年
3 本报记者 刘松柏;“超级月球”引发地震不成立[N];经济日报;2011年
4 权证一级交易商 国信证券;正股走势及时间序列主导下半年权证市场运行结构[N];证券时报;2006年
5 房鹏;数码书信寄真情[N];中国电脑教育报;2005年
6 刘丽萍;时间序列季节调整描述经济活动的利器[N];中国信息报;2000年
7 西南证券高级研究员 董先安德圣基金研究中心 郭奔宇;预计6月CPI同比上涨7.2%[N];证券时报;2008年
8 国泰君安期货 吴泱 郑腾;基金持仓与期货价格关系的实证研究[N];期货日报;2008年
9 倪成群;人民币升值背景下中外金价和黄金投资收益关联性研究[N];期货日报;2008年
10 中期研究院 王璐 吕圳;重标极差法的期货品种收益波动性研究[N];期货日报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978