基于Tensorflow的循环神经网络模型在上海市空气质量预测中的应用
【摘要】:近年来,空气污染日益严重。有效地监控空气质量,准确地预测空气污染物浓度对预防大气污染有重要的指导意义。此外,由于空气质量具有时序性,会受多个难以确定的污染源影响,经常用到的回归预测方法效率和精度都比较低,而循环神经网络模型却能有效利用时序数据中长距离依赖信息的能力,对此类数据进行相关的预测分析。本文将尝试利用上海市空气质量监测站的小时均值数据,基于Google开源Tensorflow机器学习框架并使用长短期记忆单元(longshort-termmemory,LSTM)的循环神经网络建立动态预测模型,同时采用基于时序的反向传播(BPTT)算法逐步更新网络权值进行网络训练,期望能够建立影响空气质量指标的_2,_2,_3,_(10),_(2.5),CO这6种污染物的小时均值级别的空气污染物浓度预测模型。本文的主要工作及贡献如下:利用灰色关联分析法与主成分分析法分别对大气污染物浓度预测模型中的输入变量进行筛选,筛选出对预测监测因子浓度影响较大的污染物并建立相关的预测模型。然后基于测试数据,分别对两种预测模型使用MAE、MSE、~2等评价指标对预测模型进行评价。最终验证了基于Tensorflow训练的循环神经网络能较精准地应用于空气污染物的浓度预测。