基于机器学习算法模型的白酒股票预测研究
【摘要】:随着我国金融市场的发展,股票价格预测受到各界人士的重视,股票预测能够为金融市场投资者带来丰厚收益,也能够成为风险管理的工具。机器学习与人工智能技术发展日益完善,已在多个领域达到惊人效果,机器学习与深度学习算法模型能够处理海量数据,从中快速处理分析规律,众多学者尝试将多种机器学习模型应用在金融领域,建立在数学模型上的量化投资分析技术得到了广泛应用。股票数据具有非线性、高噪声、非平稳的特点,能够找到合理的梳理股票数据的方法构建非线性机器学习模型,探究股票价格涨跌规律,都具有现实和理论意义。时下白酒板块股票关注度高,本文主要对白酒股票市场价格涨跌情况进行预测与研究,选取申万行业分类中全部白酒股票数据进行研究,首先考虑到金融市场具有很多扰动因素,股票时间序列数据中包含大量噪声,使用小波阈值降噪对数据进行预处理,提取股票数据中的有用信号。实证部分以两只股票为例,展示股票收盘价通过小波降噪前后的对比图。本文主要使用LSTM,支持向量机与XGBoost模型对白酒股价做预测研究,LSTM能挖掘时间信息,可以很好地拟合预测股票价格,XGBoost是新兴的Boosting集成算法模型,高效且精准,支持向量机算法原理简单,有良好的推广能力。本文选取了2015年3月2日至2020年3月2日的白酒股票数据作为此次的研究样本,股票数据取自wind数据库,数据处理及建模过程在python语言中完成,使用行情指标及相关技术指标,通过特征工程增广构建更多特征作为模型的输入变量,实证结果表明,三个机器学习模型对股票收盘价走势均具有优秀的预测拟合能力。本文使用MAE、RMSE、MAPE、R2评价模型预测效果,LSTM表现最优,同时证明了新兴机器学习算法XGBoost在股票价格预测上的可行性,相对于其他算法LSTM、支持向量机等,XGBoost运行速度快,具有一定优势。本文在原有算法模型基础上继续尝试对模型进行优化,使用遗传算法对XGBoost调参,选出较好的参数集,经过多次迭代提高模型预测效果;将encoder-decoder编码-解码结构加入LSTM模型中,并使用attention注意力机制,尝试提升模型预测能力。