基于数据的复杂系统集成建模方法及其应用研究
【摘要】:建模是分析问题和解决问题的一种重要手段。随着对象复杂性的增加,越来越多地采用基于数据的经验建模方法。对于复杂的非线性系统或是高维对象,一般的建模方法要么无法达到期望的预测精度,要么模型过于复杂,很难进行进一步的分析和利用,例如很难进行稳定性分析或者设计合适的控制器。因此需要采用一种新的建模方法。集成方法就是这样一种算法,它可以有效提升低精度、简单算法的泛化性能,广泛应用于机器学习和系统辨识领域。本文主要研究集成方法在复杂系统建模(包括稳态系统建模和动态系统建模)中的应用,包括以下几个方面的内容:
1.对现有的集成方法,从子模型的产生方式、集成方法的理论研究,集成算法的应用研究三个方面进行了介绍。
2.对于集成算法在稳态系统建模中的应用进行了研究。首先对AdaBoost.R算法进行了介绍并进行了改进,使其能更好地适用于小样本的情况。然后对PLS算法进行修改使其能够被集成方法直接调用以应用于对象的稳态系统建模。接下来从梯度下降搜索理论的角度对boosting方法进行修改,提出了用于稳态系统建模的LS-Ensem算法并从理论上证明LS-Ensem方法可以有效提高模型的精度,还给出该算法渐近收敛的理论证明以及泛化误差的界。仿真实验显示这种算法能够有效克服由于噪声影响而带来的过拟合现象。
3.对于集成方法在动态系统建模中的应用进行了研究。提出了一种搜索、聚类、模式分类和线性辨识技术相结合的PWARX模型辨识方法。该方法利用模型参数的协方差矩阵值作为性能指标,在样本数据点中进行搜索,得到数据点的初步聚类。然后对初步聚类进行反复校正得到数据点的最终聚类,并根据数据点的聚类进行区间划分和子模型辨识。这种方法能适用于区间分割情况未知,甚至连有多少个不同区间都不知道的情况。两个仿真研究的结果验证了这种算法的有效性。
4.将本文提出的基于数据的集成建模方法分别应用在汽油辛烷值的软测量(稳态系统建模)以及贴片机元器件放置过程的辨识(动态系统建模)中。进一步证实了本文提出的集成建模方法的有效性。