时间最优控制的Mayer逼近算法
【摘要】:
本文主要讨论一种时间最优控制问题的数值解法。众所周知,动态规划法是求最优控制问题解的一种非常重要的方法,特别在处理用极大值原理不能处理的反馈最优控制问题中,展现了其优越性。而在使用动态规划法求解时间最优控制问题时,由于终端时间的未确定性,给问题的求解带来一定的困难。
本文采用动态规划方法给出了一种间接求解时间最优控制问题的近似算法。通过引入适当的变换,我们首先将时间最优控制问题转换为一系列终端时间固定的Mayer问题;然后通过引入恰当的粘性因子,将动态规划方法中求解与Mayer问题相应的Hamilton-Bellman-Jacobi方程粘性解的问题转换为对流-扩散方程的求解,进一步采用特征差分法,数值求解此对流-扩散方程,从而得到了一种数值求解时间最优控制问题的近似算法。最后,给出了一个数值例子说明我们算法的可行性。
具体过程如下:设受控系统为
其中V_(ad)表示容许控制集。那么对系统(0.1),时间最优控制问题就是在容许控制集V_(ad)里寻找一个最优控制v~*,v~*将状态经过时间t后从初始状态z_0变到希望达到的目标状态z_1,并且使得所经过的时间最短。为了讨论这一类时间最优控制问题(P),我们首先引入适当的变换t=ks(O≤s≤1,k∈R~+),通过该变换系统(0.1)变为下列形式:
此处x(x)=z(ks),u(s)=v(ks)。设允许控制集为W={(u,k)|u(s)=v(ks),0≤s≤1,v∈V_(ad),k∈R~+}
定义目标泛函为
其中x(u,k)是(0.2)对应控制w′=(u,k)的解。
问题(P_ε)是寻求w~*∈W使J_ε(w~*)≤J_ε(w′).
则在一定条件下,时间最优控制问题(P)的解为可由这一列终端时间固定的Mayer问题(P_ε)来逼近求解。
对Mayer问题(P_ε),我们引入粘性因子采用动态规划方法进行求解,从而实现最优,即根据动态规划方法得到与问题(P_ε)相应的值函数
和HJB偏微分方程
然后引入粘性项将求HJB偏微分方程(0.4)的粘性解转化为求对流-扩散方程的古典解。进一步采用特征差分方法,数值求解这个对流-扩散方程。
最后得到一种时间最优控制问题的数值解法。