基于机器学习的南中国海台风预测若干算法比较研究
【摘要】:南中国海区域是台风高发的区域之一。南中国海台风的肆虐侵袭给我国东南沿海居民带来了难以估计的损失。台风路径的准确预测对于防灾避险有着重要的意义。本文以7~9月份南中国海台风数据集为例,探究如何提高台风路径预测的精度。台风路径的影响因素复杂,单一模型难以准确预测不同路径特点的台风预测。预报因子的特征提取是影响预测结果的重要因素之一。因此,针对影响台风路径预测的几个难点问题,本文提出三种相应的预测方案。主要的研究工作如下:1.针对单一模型预测不同路径变化的台风存在局限性的问题,本文提出了基于MDN的概率预测模型。利用MDN组合多个概率函数的特点,可以更好地拟合出预测值的概率分布。并且通过经度和纬度的概率函数组合给出了台风路径的概率分布图,以便于应用在台风预报工作中。2.针对预报因子的特征提取和学习比较片面的问题,本文基于CGAN优秀的学习能力,提出了基于CGAN和LSTM的预测模型。以LSTM和MLP改造CGAN的模型结构,分别提取预报因子中的多样特征,并且改进了模型的损失函数。3.针对深层网络容易丢失预报因子表层特征的问题,本文提出了基于BLS的Bagging集成预测模型。BLS的映射节点可以尽可能地保留预报因子的原始信息,Bagging集成的方式有助于提高BLS作为子模型的预测精度。本文以逐步回归模型为基准模型,对提出的三种预测模型分别进行了对比实验,实验结果表明本文提出的三种模型分别降低了16.28 km、8.76 km和22.82km的预测误差。最后本文对三种模型的预测性能以及优缺点进行了对比分析。