收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

时滞随机系统的最优控制问题及应用

陈丽  
【摘要】: 近些年来,人们逐渐认识到现实世界中的一些问题的发展不仅依赖于当前的状态,而且还依赖于其过去的历史。这类问题应该用状态对过去有依赖的系统方程来刻画,我们称之为随机微分延迟方程(简记为SDDE).由于其在工程、生命科学及金融等领域的广泛应用(可参见[3;11;43;44;47;33]等),SDDE成为现代研究的热点问题。本文将致力于在金融及其他领域中常见的受控的延迟系统的研究。 对于一个系统而言,当观测与调控之间有时间差或者控制有滞后性时就会出现系统延迟,我们称之为时滞系统。2000年,(?)ksendal和Sulem[47]研究了一类财富方程为SDDE的最优控制问题。在他们的模型中,不仅当前值X(t)而且X(t-δ)及过去值在某种意义下的平均值都会影响t时刻财富的增长。由于所选模型的特殊性,他们能够将无穷维问题化为有限维问题来处理,得到了问题的最大值原理,并将结果应用于金融中的相关问题。但是他们的条件,相对来说,是比较强的。 在实际当中,观测过去的数据可能是离散的有限个点,因此我们首先考虑当前发展依赖于以往有限个点的系统,而且控制也具有延迟性,这些延迟还可以是时变的。 我们研究一类时滞系统的最优控制问题,其中状态及控制变量都有延迟。在相对比较一般的条件下,我们得到了这类受控的时滞系统的最大值原理。作为应用,我们用得到的结果处理了经济当中一类带有时滞的生产消费选择问题,并得到了问题的显示解。借助于数值计算,我们给出了不同的延迟时间对结果的影响情况。我们的主要创新在于引入新型的倒向随机微分方程(简称BSDE)一超前BSDE(参见Peng,Yang[55])作为伴随方程来处理时滞最优控制问题。据我们所知,这是首次采用这种方法来研究时滞控制系统的最优控制问题。 我们也考虑了具有时变延迟的正倒向系统,即用递归效用函数代替一般的效用函数且延迟δ不在是常数,而是时间t的函数。这部分结果推广了1995年Xu[65]中的结论。Hu,Peng[29],Peng,wu[54]和Yong[69]等相继研究了完全耦合的正倒向随机微分方程(简称FBSDE).在处理线性二次(LQ)问题(参见[62;67])和金融中的大户投资问题(参见Cvitanic和Ma[15])时都会遇到这类方程。而我们在探索时滞系统的最大值原理问题时遇到了一类新型的FBSDE,其正向方程为时滞随机微分方程,倒向方程为超前倒向随机微分方程.我们称其为推广的FBSDE,并给出了这类新型FBSDE解的存在唯一性条件. 早在1973年Kolmanovskii and Maizenberg就讨论了时滞随机系统的LQ问题。我们在此基础上考虑状态与控制都有延迟的LQ问题,并且用FBSDE和值函数两种方法来寻找最优反馈控制。另外,我们也将关于推广的FBSDE的结果应用于时滞线性二次非零和随机微分对策问题。 考虑一般情况,我们处理一类由随机泛函微分方程(简称SFDE)刻画的时滞系统的递归最优控制问题,其中系统及递归效用函数的变动都依赖于过去的一段状态而不仅仅是有限个点。对此类问题,我们证明了其值函数仍满足Bellman型的动态规划原理。由于对过去状态依赖形式的复杂性,完整形式的Ito公式和Dynkin公式都很难得到,故想进一步得到值函数满足的Hamilton-Jacobi-Bellman方程并不是件容易的事情。为此我们引入Mohammed [44]中提到的弱无穷小生成元及Fuhrman等[24]中用到的联合二次变差作为工具,得到了上述问题值函数对应的一个无穷维的HJB方程。而且我们也证明了值函数就是这个无穷维偏微分方程的粘性解。 最后,作为理论的应用,我们考虑一类具有延迟效用的广告问题即广告费用支出与产生效果之间会有一定的时间差。Gozzi和Marinelli在[26]中用动态规划原理的方法讨论过这类问题。我们采用与他们不同的方法-无穷维最大值原理来处理这类问题,这种方法是由Hu和Peng[28]首次提出的。这部分结果也是我们论文2.3部分在无穷维空间中的一个推广 本论文由5章内容组成,下面我们将列出主要结果。 第1章:介绍第2章-第5章所要研究的问题。 第2章:我们研究状态方程为如下形式的时滞系统的最优控制问题:首先我们给出此类SDDE解的存在唯一性。接着我们考虑控制域为凸集时的情形,得到了如下的最大值原理。 定理2.2.6.令u(·)为时滞随机最优控制问题(2.3)-(2.5)的最优控制,X(·)为其相应的最优轨线。则我们有如下论断:其中对任意0≤t≤T.Hamilton函数定义为:(p(·),z(·))为如下超前BSDE的解 更进一步,我们可以得到如下的控制最优的充分条件. 定理2.2.8.假设u(·)∈A,令X(·)为其相应的轨线,p(t)和z(t)为伴随方程(2.12)的解。如果(H2.5)-(H2.6)及(2.13)(或(2.16))成立,则u(·)为时滞控制问题(2.3)-(2.5)的最优解。 利用得到的最大值原理,我们研究了一类时滞的生产消费选择最优化问题.生产资本x(t)满足如下方程:问题是如何选取消费率c(t)最大化代价泛函 下面的命题给出了最有控制问题的显示解,而且从Figure 1和Figure 2中我们可以看出不同的时间延迟对结果的影响情况。 命题2.2.9.对生产消费选择问题(2.17)-(2.18),最优消费率为c*(t)=(?),其中p(t)如式(2.20)中的形式。 接着,我们考虑了控制域非凸时的递归最优控制问题。假设延迟是时变的,且扩散项σ不含控制,即系统由如下的时滞正倒向方程来描述: 定理2.3.6.假设u(·)为最优控制,(x(·),y(·),z(·))为其相应的最优轨线。则对所有0≤tT,我们有这里k(s)为s=t-ζ(t)的反函数且Hamilton函数H由(2.34)式定义。 第3章:我们考虑时滞最优化问题中遇到的一类推广的FBSDE: 定理3.1.3.若(H3.1)及(H3.2)成立,则推广的FBSDE (3.1)有唯一适应解(X,Y,Z). 我们研究了两类时滞LQ问题,寻找它们的最优控制的显示形式。 在问题3.1中,我们假设只有状态有延迟。借助于FBSDE的结果,我们有 定理3.2.1.控制 为问题3.1的唯一最优控制,其中(χt,yt,zt)为如下的推广的FBSDE的解 第二种情况,即问题3.2,我们假设系统的状态及控制都有延迟。通过一类更为复杂的FBSDE我们给出其最优控制的形式。 定理3.2.2.控制为问题3.2的唯一最优控制,其中(x(t),y(t),z(t))为推广的FBSDE (3.14)的解。 我们引入两种方法来寻找最优反馈控制。这两种方法是从解决最优控制问题的经典方法-最大值原理和动态规划原理这两个不同的角度出发的。 从最大值原理的角度出发,我们有: 定理3.3.1.假设存在矩阵值过程(Kt,Ht),t∈[0,T],满足广义的矩阵Riccati方程(3.19).则时滞线性二次最优控制问题问题3.3的最优反馈控制为且最优值函数为 从动态规划原理的角度出发,我们有: 定理3.3.3.设(3.25)中引入的满足如下带边值条件的方程组:对任意t∈[0,T]及θ,ζ∈[-δ,0], 则对问题3.4, 为[s,T](s≥δ)上的最优控制且值函数为 在第3章的最后,我们讨论时滞线性二次非零和随机微分对策问题。 定理3.4.1.当且仅当(u1(·),u2(·))具有如下形式时,(u1(·),u2(·))为对策问题Problem 3.5的一个Nash均衡点。其中为推广的FBSDE(3.29)的解。 第4章:我们给出了由如下SFDE刻画的时滞系统的递归最优控制问题的动态规划原理: 定理4.2.10.若A4.4-A4.8成立,则(4.9)式定义的时滞最优控制问题的值函数u(s,φ)具有如下的优良性质:对任意0≤(?)≤T-s,(?) 我们得到了值函数满足的HJB方程—一类无穷维的偏微分方程。 定理4.3.9.如果假设我们问题中的值函数则u(s,φ)为如下的Hamilton-Jacobi-Bellman偏微分方程的解:这里我们以▽0u(t,x)记▽xu(t,x)({0}). 我们有: 定理4.3.11.如(4.9)式定义的u(s,φ)为HJB方程(4.33)的一个粘性解。 第5章:在最后一章,我们研究一类广告模型中的时滞随机控制问题作为我们理论的应用。这类时滞的广告模型可以重新定义于Hilbert空间。我们利用无穷维的最大值原理处理该类问题: 定理5.3.1.Let(u(·),X(·),Y(·),Z(·))为问题5.1的最优控制及相应的轨线。则如下的最大值原理成立:其中(p(·),q(·),k(·))为如下伴随方程的解 这里A是一个强连续半群的无穷小算子,A*为它的伴随算子。若给定某些效用函数我们可以给出最优控制的显示形式。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 石北源;张焰辉;;一类无穷维随机系统最优控制的鞅方法[J];中山大学学报(自然科学版);1991年01期
2 焦红兵;非定常经济系统控制模型的最优控制问题[J];数学的实践与认识;2005年06期
3 付莲莲;;一类改进的非线性种群系统的最优控制[J];系统科学与数学;2009年08期
4 王珊;谢文秀;王辉;;具有四个状态的系统解的最优控制[J];哈尔滨师范大学自然科学学报;2009年05期
5 毕大川;王康宁;;具有分布参数控制系统的最优控制问题[J];科学通报;1966年06期
6 是兆雄;微分对策与最优控制[J];自然杂志;1983年10期
7 林威;加权跟踪最优自适应控制[J];复旦学报(自然科学版);1987年04期
8 周原;;RSO法求解代数Riccati方程及其在电力系统最优控制中的应用[J];贵州工业大学学报(自然科学版);1987年02期
9 吴建武;李春文;张靖;;SU(1,1)型双输入量子系统能量最优控制[J];系统科学与数学;2007年03期
10 罗丽;潘立平;;带有控制-状态混合约束的时滞Volterra型积分系统的最优控制问题[J];数学年刊A辑(中文版);2007年03期
11 王世凯;贾诺;刘宏亮;;可修复人机储备系统稳态解的最优控制[J];数学的实践与认识;2010年17期
12 马明;;爹数不确定统一混沌系统的最优控制[J];大众科技;2010年11期
13 姜雪;赵辉;王辉;;一个备用部件的可修复人机系统的最优控制[J];数学的实践与认识;2010年19期
14 黄小玉;;一类二阶常微分方程的利普希茨控制问题研究[J];西安石油大学学报(自然科学版);2011年04期
15 张嗣瀛;轨线两端均受限制时的最优控制问题[J];东北大学学报(自然科学版);1964年02期
16 张嗣瀛;;相空间坐标受限时的最优控制问题[J];自动化学报;1966年02期
17 杨自厚,李世卿,李宝泽,汪谊臣;电力拖动的最优控制问题[J];东北大学学报(自然科学版);1980年03期
18 潘日晶;;无限维系统的线性二次奇异最优控制问题[J];福建师范大学学报(自然科学版);1985年03期
19 曹宇辉;张瑜;王辉;;有储备的可修复子系统脆性故障的研究[J];哈尔滨师范大学自然科学学报;2007年02期
20 王辉;金鸿章;;可修复复杂系统脆性故障的研究[J];数学的实践与认识;2007年19期
中国重要会议论文全文数据库 前10条
1 蔡远利;李鹏;;离散时间最优控制问题的一种神经网络新解法[A];1995年中国智能自动化学术会议暨智能自动化专业委员会成立大会论文集(上册)[C];1995年
2 吴建武;李春文;张靖;;SU(1,1)型双输入量子系统能量最优控制[A];第二十六届中国控制会议论文集[C];2007年
3 李建勋;佟明安;;敌对1:1空战完整化研究[A];1995中国控制与决策学术年会论文集[C];1995年
4 胡克定;王树松;;分段线性函数应用于延时系统的最优控制[A];1994中国控制与决策学术年会论文集[C];1994年
5 郭磊;于瑞林;田发中;;跳变时刻状态受约束的跳变系统的最优控制[A];第二十四届中国控制会议论文集(上册)[C];2005年
6 赵文荣;侯学章;朱广田;;关于双线性分布参数系统的一类最优控制[A];1994年中国控制会议论文集[C];1994年
7 王德明;许东霞;姚侃;;具有二次型性能指标的离散双线性系统最优控制[A];2006中国控制与决策学术年会论文集[C];2006年
8 容浩;穆志纯;刘克;;一类线性切换系统的优化控制研究[A];第二十二届中国控制会议论文集(下)[C];2003年
9 陶世明;朱经浩;;Canonical对偶方法与一类最优控制问题[A];中国运筹学会第九届学术交流会论文集[C];2008年
10 徐爱平;吴臻;;状态约束下的一类正倒向随机系统的最优控制问题[A];1997中国控制与决策学术年会论文集[C];1997年
中国博士学位论文全文数据库 前10条
1 陈丽;时滞随机系统的最优控制问题及应用[D];山东大学;2010年
2 秦廷华;微分方程最优控制问题自适应方法[D];上海大学;2012年
3 沈万芳;积微分方程约束的最优控制问题的有限元方法[D];山东大学;2012年
4 曹伟东;双调和方程及油田注水开发最优控制问题数值分析[D];山东大学;2010年
5 李彬;含状态和控制约束的最优控制问题和应用[D];哈尔滨工业大学;2011年
6 周建伟;状态受限最优控制问题的谱方法[D];华东师范大学;2011年
7 牛海峰;流体及非线性最优控制问题的有限元方法:状态受限与超收敛分析[D];山东大学;2011年
8 于怀强;随机与确定性分布参数系统最优控制必要性条件的研究[D];华中科技大学;2012年
9 魏立峰;随机最优控制相关的HJB方程及弱解研究[D];山东大学;2009年
10 袁磊;状态受限最优控制问题的有限元方法[D];山东大学;2009年
中国硕士学位论文全文数据库 前10条
1 马善立;最优控制问题的若干问题[D];中国石油大学;2007年
2 石荣;Navier-Stokes方程组的最优控制问题综述[D];东北师范大学;2007年
3 孔凡亮;一类资产发展方程的最优控制问题[D];新疆大学;2009年
4 邓红勇;一类微波加热的最优控制的必要条件[D];贵州大学;2007年
5 刘举成;分段广义系统线性二次最优控制[D];黑龙江大学;2007年
6 邹衍华;抛物型最优控制问题有限元方法的超收敛性[D];湘潭大学;2008年
7 桂启运;一种带扩散的人口方程的最优控制问题[D];华中科技大学;2008年
8 朱敏;几类孤立波方程的最优控制[D];江苏大学;2005年
9 傅尧;一般凸最优控制问题的重构型后验误差估计[D];湘潭大学;2008年
10 沈华;离散控制系统的几个结果及应用[D];吉林大学;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978