收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

部分信息下正倒向随机系统的最优控制和微分对策理论

肖华  
【摘要】:倒向随机微分方程是一个带终端条件而不是初始条件的Ito型随机微分方程。倒向随机微分方程的线性形式由Bismut[7]引入,而非线性形式由Pardoux和Peng[39]、Duffie和Epstein [13]分别独立引入。倒向随机微分方程与一个正向随机微分方程相藕合,形成了一个正倒向随机微分方程.自从被引入以来,正倒向随机微分方程在许多不同领域,特别在随机控制、金融数学方面备受关注。比如:源自随机最优控制的经典的哈密顿系统就是一类正倒向随机微分方程;用于期权定价的Black-Scholes公式能够通过正倒向随机微分方程来表示得到。有关正倒向随机微分方程的更多内容,参见Ma和、'ong [34]、Yong和Zhou[70]的专著。由于正倒向随机微分方程是很好的动态系统,我们很自然地去考虑其系统下的随机最优控制和微分对策问题。本文将致力于研究完全和部分信息下的正倒向随机微分方程的随机滤波、最优控制和微分对策。 Wang和Wu[54]首先研究了系统状态和观测方程由布朗运动所驱动的正倒向随机系统的滤波理论.他们提出了一种倒向分离的技术,而这种技术在解决部分可观的最优控制问题时比Wonham[59]的分离原理更方便.受Wang和Wu的工作的启迪,我们研究了系统状态和观测方程由布朗运动和泊松过程联合驱动的正倒向随机系统的滤波方程,并将其应用到一类带随机跳的部分可观的最优控制问题。由于泊松过程随机跳跃的性质,我们得到了不同于Wang和Wu[54]的一些新的有趣的结果。 Shi和Wu[47]研究了一类带随机跳的部分藕合的正倒向随机微分方程的最优控制问题,Wu[61]研究了不带跳的部分可观的正倒向随机微分方程的最优控制,他们都要求控制域是凸的.Wang和Wu[55]则研究了控制域非凸、正向方程扩散项系数不含控制变量的部分藕合的正倒向随机系统的部分可观的最优控制问题。基于前面的工作,Xiao[63]考虑了带有随机跳跃的部分藕合正倒向随机系统、控制域是凸的情况下的部分可观的最优控制问题,得到了最优控制需要满足的一个必要条件和充分条件,将Shi和Wu[47]推广到部分可观的情况,将Wu[61]推广到随机跳的情况,也部分推广了Liptser和Shiryayev [33],Bensoussan [6], Tang [50], Wang和Wu[54,55]的结果到随机跳或者正倒向系统的情形。然而,前述工作都没有考虑状态和观测有相关噪声的情形。据我所知,目前仅有Tang[50]考虑了正向连续状态与观测过程具有相关噪声的情况,得到了一般的随机最大值原理。在这里,我们研究了具有相关噪声的、带有随机跳跃的正倒向随机系统的最优控制问题.在凸控制域的条件下,我们得到了一个最大值原理和一个验证定理.当前的工作能够包含Shi和Wu[47]、Wu[61]的结果,能够部分推广Shi和Wu[48]、Wang和Wu[55]到随机跳跃,Tang和Hou [51]、Xiao[63]到相关噪声,Tang[50]到正倒向跳扩散系统,Peng[41]到部分信息的情形. 到目前为止,仅有两篇文章考虑倒向随机微分方程的微分对策问题:一篇是Yu和Ji[72],运用完全平方技术研究了线性二次非零和微分对策,得到了一个显式的纳什均衡点;另一篇是Wang和Yu[56],研究了非线性倒向随机微分方程的微分对策问题,以最大值原理的形式给出了纳什均衡点的充分和必要条件。上述对策问题都局限于倒向系统的研究,据我所知,Buckdahn和Li[8]、Yu[71]研究了正倒向系统的微分对策问题。在Buckdahn和Li[8]里,对策系统的值函数通过倒向方程在零时刻的解定义,进而证明了一个动态规划原理,并揭示对策的上下值函数是Hamilton-Jacobi-Bellman-Isaacs方程唯一的粘性解。最近,Yu[71]研究了正倒向系统线性二次非零和的对策问题.在本文,我们将要研究的是更一般的情形,即非线性的部分藕合的正倒向随机微分方程的微分对策问题,联合正倒向随机微分方程理论和经典的凸变分技术,得到了非零和对策均衡点与零和对策鞍点的最大值原理和验证定理。 为了更好地刻画市场中所谓的非正常交易现象(比如内部交易)以及寻找部分信息倒向重随机微分方程线性二次非零和微分对策均衡点的显式解,我们关心一类新的部分信息下起始点藕合的正倒向重随机微分方程的微分对策问题。这类问题具有更广泛的理论和实际意义。首先,正倒向重随机系统包含许多系统作为它的特例。例如:如果我们去掉倒向Ito积分项,或者正向方程,或者两者同时去掉,则正倒向重随机系统退化为正倒向随机系统,或者倒向重随机系统,或者倒向系统;其次,所有的结果能够退化成完全信息的情形;最后,如果当前的零和随机微分对策仅有一个参与者,则对策问题退化成一些相关的最优控制问题。更详细说的话,我们的结果是如下一些研究工作的部分推广:部分信息倒向随机微分方程和正倒向随机微分方程的最优控制(见Huang, Wang和Xiong [20], Xiao和Wang [64]),完全信息的倒向重随机微分方程的最优控制(见Han, Peng和Wu[18]),完全信息和部分信息的倒向随机微分方程的微分对策(见Wu和Yu[56],Yu和Ji[72]Zhang [73],Wu和Yu[57]). 本文共分四章,主要结果如下。 第一章:我们对第二到第四章研究的问题进行了简要的介绍。 第二章:我们研究了线性的带随机跳跃的正倒向随机微分方程的随机滤波。通过应用得到的滤波方程,我们求解了一个部分可观的线性二次的最优控制问题,得到了一个显式可观的最优控制。 定理2.1设条件(H2.1)和(H2.2)成立,方程(2.14)存在解,则状态(x,y,z1,z2,r1,r2)的滤波估计(πt(x),πt(y),πt(z1),πt(z2),πt(r1),πt(r2))由(2.14),(2.22)和(2.23)表出,滤波估计πt(x)的条件均方误差由(2.21)表出. 推论2.1假定a6(·)=a10(·)三0,即x(·)和N1(·)不会同时发生跳跃,则(2.14)变为(2.22),(2.23)和(2.21)仍然成立,其中相应的a6(·)和a10(·)由零代替。 推论2.2如果c5(·)三0,即观测过程Z(·)不会发生跳跃,则(2.24)仍是相应的滤波方程,(2.22),(2.23)和(2.21)仍然成立. 定理2.2设条件(H2.1)-(H2.3)成立.则对任意的v(·)∈Uad,方程(2.30)的解xv(·)有滤波估计和这里采用了记号γ(t)=E[(xv(t)-πt(xv))2[FtZ]. 定理2.3设条件(H2.1)-(H2.4)成立,则(2.44)式表示的u(·)是前述的部分可观的最优控制问题的真正的最优控制。 定理2.4设条件(H2.1)-(H2.4)成立,则最优控制u(·)和相应的泛函指标J(u(·))各由(2.44)和(2.54)表示。 第三章:我们研究了带随机跳跃的部分可观的正倒向随机微分方程的最优控制问题,就状态和观测不相关和相关两种情况进行了分别讨论。我们以最大值原理形式确立了两种情况下最优控制的必要条件和充分条件,并举了两个例子来说明理论的应用。 引理3.1设条件(H3.1)成立,则有 引理3.2设条件(H3.1)成立,则有 引理3.3设条件(H3.1)成立,则有如下的变分不等式成立: 定理3.1设条件(H3.1)成立,u(·)是我们随机最优控制问题的最优控制,(x(·),y(·),z(·),r(·,·))是相应的最优轨迹,(p(·),q(·),k(·),L(·,·))是方程(3.19)的解。则我们有 定理3.2设(H31)和(H3.2)成立,zv(·)是FtY适应的,u(·)∈Uad是一个容许控制,(x(·),y(·),z(·),r(·,·))是其相应的轨迹.另设β(·)和(p(·),g(·),k(·),L(·,·))各自满足(3.17)和(3.19),哈密顿函数H关于(x,y,z,r,v)是凸的,且那么u(·)是一个最优控制。 定理3.3系统满足(3.30)和(3.33),容许控制集Ud如(3.32)定义,选取v(·)∈Uad使(3.29)所表示的消费泛函达到最小,这表示了一个部分可观的最优控制问题,那么如(3.35)中所示的候选最优控制u(·)是想要的唯一最优控制,其显式表达如(3.57)所示。 定理3.4设条件(H3.1)成立,容许控制集Uad如(3.1)定义,u(·)是一个最优控制,{p,(Q,K,K,R),(q,k,k,r)}是方程(3.68)在控制u(·)下相应的Ft适应的平方可积的解,则最大值原理对任意的v(·)∈Uad都成立。 定理3.5设条件(H3.1)和(H3.2)成立,pv(·)是FtY适应的,u(.)∈Uad是一个容许控制,其相应的状态轨迹为(x(·),y(·),z(·),z(·),r(·,·)).又设{p,(Q,K,K,R),(q,k,k,r)}是方程(3.68)的解,哈密顿函数H(t,u(t))关于(x,y,z,z,r,v)是凸的,且有则u(·)是一个最优控制。 第四章:我们首先研究了终端藕合的正倒向随机微分方程的微分对策问题,给出了最大值原理形式的必要性条件和充分条件。这个研究的动机之一是为了寻找非线性期望下线性二次零和微分对策鞍点的显式解。为了更好刻画所谓市场中非正常交易现象(比如内部交易)以及寻找部分信息倒向重随机微分方程线性二次非零和微分对策均衡点的显式解,我们接着研究了一类新的部分信息下起始点藕合的正倒向重随机微分方程的微分对策问题。对非零和对策的纳什均衡点和零和对策的鞍点,我们都给出了必要性条件和充分性条件。 引理4.1设条件(H4.1)成立,则对i=1.2,有下式成立: 引理4.2设条件(H4.1)和(H4.2)成立,则对i=1,2,下述的变分不等式成立: 定理4.1设条件(H4.1)和(H4.2)成立,(u1(·),u2(·))是问题Ⅰ的一个均衡点,(x(·),y(·),z(·))和(pi(·),qi(·),ki(·))是(4.10)和(4.23)相应的解,则有和对任意的(v1(·),v2(·))∈U1×U2,a.e.a.s..成立。定理4.2设条件(H4.1),(H4.2),和(H4.3)成立,(u1(·),u2(·))∈U1×U2是一个容许控制,(x,y,z)和(pi,qi,ki)方程(4.10)和(4.23)相应的解.假定 对任意的(t,a,b,c)∈[0,T]×Rn×Rm×Rm×d存在,对任意的t∈[0,T],关于(a,b,c)是凹的(Arrow条件),且则(u1(·),u2(·))是问题Ⅰ的一个均衡点. 定理4.3设条件(H4.1)和(H4.2)成立,(u1(·),u2(·))∈U1×U2是问题Ⅱ的一个鞍点,(x,y,z)和(p,q,k)是方程(4.10)和(4.23)的解,这里的哈密顿函数H1和H2如(4.37)和(4.38)定义.则有和对任意的(v1(·),v2(·))∈U1×U2,a.e.a.s.成立。 定理4.4设条件(H4.1),(H4.2)和(H4.3)成立,(u1(·),u2(·))∈U1×U2是一个容许控制,(x,y,z)和(p,q,k)是方程(4.10)和(4.41)的解。假定哈密顿函数H满足如下的条件最小最大值原理:(ⅰ)设φ和γ都是凹函数,对任意的(t,a,b,c)∈[0,T]×Rn×Rm×Rm×d存在,且关于(a,b,c)是凹的.则对任意的v2(·)∈U2,有和成立。(ⅱ)设φ和γ都是凸函数,对任意的(t,a,b,c)∈[0,T]×Rn×Rm×Rm×d成立,关于(a,b,c)是凸的.则对任意的v1(·)∈U1,有和成立。 (ⅲ)设(ⅰ)和(ⅱ)都成立,则(u1(·),u2(·))是一个鞍点,且 定理4.5设条件(H4.4)成立,(u1(·),u2(·))是问题(NZSG)的一个均衡点,而且(y(·),z(·),Y(·),Z(·))和pi(·),pi(·),qi(·),qi(·))是方程(4.62)和(4.63)相应于(u1(·),u2(·))的各自的解。则有和对任意的(v1(·),v2(·))∈U1×U2,a.e.a.s.成立。 推论4.1设条件(H4.4)成立,对任意的t∈[0,T],εt=Ft,(u1(·),u2(·))是问题(NZSG)的均衡点,而且,(y(·),z(·),Y(·),Z(·))和(pi(·),pi(·),qi(·),qi(·))是方程(4.62)和(4.63)相应于(u1(·),u2(·))的各自的解。则有和对任意的(v1(·),v2(·))∈U1×U2,a.e.a.s.成立. 定理4.6设条件(H4.4)和(H4.5)成立,(y,z,YZ)和(pi,pi,qi,qi)是方程(4.62)和(4.63)相应于(u1(·),u2(·))的解。假定φi和γi各自关于Y和y(i=1,2)是凹的,对任意的(t,y,z,Y,Z,)∈[0,T]×Rn×Rn×1×Rm×Rm×d,(y,z,Y,Z,v1)→H1(t,y,z,Y,Z,v1,u2(t),p1(t),p1(t),q1(t),q1(t)),(y,z,Y,Z,v2)→H2(t,y,z,Y,Z,u1(t),v2,p2(t),p2(t),q2(t),q2(t))是凹的,而且,则(u1(·),u2(·))是问题(NZSG)的均衡点。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张剑威;;空气主动悬架最优控制研究[J];中国高新技术企业;2007年10期
2 齐二石;张颖;;基于控制理论的连续生产库存管理[J];工业工程;2007年06期
3 邓安平;王勇;张海军;;物流作业分包中分包商投标战略分析[J];统计与决策;2008年14期
4 丁悦;;自主创新、多元化经营与竞争博弈——基于中国汽车工业发展问题的思考[J];科技进步与对策;2008年08期
5 张玉;尹腾飞;;基于动态规划的生物调控优化算法[J];统计与决策;2010年11期
6 魏海,王兴成;干散货航运市场的可控性[J];水运管理;2005年11期
7 何焕荣;陈林林;刘兰娟;;两区域经济协调发展的投资分配问题分析[J];绍兴文理学院学报(自然科学版);2007年04期
8 夏建国;胡萃;刘芸;吴德勇;;土壤侵蚀经济损失及治理投入产出优化模型——以四川省名山县蒙山为例[J];中国水土保持科学;2007年06期
9 孙大超;魏晓平;卢南;;基于累计开采量的资源税费改革分析[J];商业研究;2010年08期
10 杨米会;;基于Fuzzy的煤炭企业成本决策[J];煤炭经济研究;2011年01期
11 张启敏,聂赞坎,刘文安;固定资产投资系统的稳定性分析及最优控制问题[J];应用数学;2002年04期
12 顾小林;李磊;杨永清;孙秀兰;;网络广告竞争模型的最优控制策略研究[J];数字技术与应用;2010年11期
13 吴锟;秦成林;;投资组合和具有跳跃—扩散过程再保险的最优控制[J];应用数学与计算数学学报;2007年02期
14 刘新梅;徐润芳;燕方;;完全竞争条件下资源税对于不可再生资源累积开采量的影响[J];系统工程;2008年01期
15 孙中才;;经济增长与环境监测[J];信阳师范学院学报(哲学社会科学版);2010年01期
16 张颖;;采用最优控制方法计算我国森林涵养水源的价格[J];中国水土保持科学;2011年03期
17 张光澄;贺昌政;;企业优化生产库存管理系统[J];四川大学学报(工程科学版);1991年03期
18 罗德明,都东跃;国民经济消费与积累的最优解研究[J];运筹与管理;2003年04期
19 刘有飞,吴复立,K.L.Teo;最优控制理论应用于发电商竞价的研究思路[J];电力系统自动化;2005年12期
20 曹黎侠;;物资库存的最优控制[J];西安工程科技学院学报;2005年04期
中国重要会议论文全文数据库 前10条
1 司徒荣;;Hilbert空间中随机微分方程的强解与按轨道最优控制[A];1996年中国控制会议论文集[C];1996年
2 韦林;方明霞;;最优控制冷却塔预张力的安全度[A];第九届全国结构工程学术会议论文集第Ⅱ卷[C];2000年
3 张顺宝;;基于神经网络的结构振动最优控制[A];第九届全国结构工程学术会议论文集第Ⅰ卷[C];2000年
4 任玉辉;张涛;孟庆华;柏庆岩;张东平;王云川;;轧钢加热炉加热过程最优控制与智能系统的开发与应用[A];2004全国能源与热工学术年会论文集(2)[C];2004年
5 孙亮;樊铭渠;;一类仿射非线性系统的最优控制:改进逐次逼近法[A];第二十七届中国控制会议论文集[C];2008年
6 叶建斌;郭鸿武;;三级倒立摆的LQG最优控制应用研究[A];中南六省(区)自动化学会第二十九届学术年会论文集[C];2011年
7 鲁守银;刘晓平;;非线牲不确定系统的鲁棒最优控制[A];1994年中国控制会议论文集[C];1994年
8 高越农;;作为整体最优控制必要条件及邻域最优控制充分条件的极小值原理[A];1997年中国控制会议论文集[C];1997年
9 廖福成;姜春梅;;用扩大误差系统法同时处理目标值预见与干扰预见[A];1997中国控制与决策学术年会论文集[C];1997年
10 张平;陈宗基;;基于伪逆法的自修复飞控系统的控制律重构[A];1995年中国控制会议论文集(下)[C];1995年
中国博士学位论文全文数据库 前10条
1 肖华;部分信息下正倒向随机系统的最优控制和微分对策理论[D];山东大学;2011年
2 孟庆欣;有跳跃的随机系统的最优控制[D];复旦大学;2010年
3 赵瑞艳;具有切换结构的非线性系统最优控制方法研究[D];中国石油大学;2011年
4 高彩霞;非线性脉冲动力系统的最优控制及应用[D];大连理工大学;2005年
5 刘昌贵;注气提高石油采收率最优控制的理论、方法和实现[D];西南石油学院;2002年
6 刘重阳;非线性切换动力系统的最优控制及应用[D];大连理工大学;2010年
7 张城明;非线性时滞系统最优控制及在海洋平台减振控制中的应用研究[D];中国海洋大学;2010年
8 王珺;开环非合作微分对策及其在经济中的应用[D];吉林大学;2011年
9 张晶;中国房地产市场两类主从微分对策研究[D];重庆大学;2011年
10 钱伟懿;非线性多阶段最优控制系统理论、算法及应用[D];大连理工大学;2004年
中国硕士学位论文全文数据库 前10条
1 徐永锋;随机中立型微分动力系统的最优控制[D];广州大学;2010年
2 孙亮;非线性大系统最优控制:逐次逼近法[D];中国海洋大学;2004年
3 李双增;一类脉冲微分系统的最优控制[D];哈尔滨工业大学;2010年
4 杨佩佩;双线性系统近似最优控制方法的研究[D];青岛科技大学;2010年
5 陶格;基于模糊控制的两级倒立摆的研究[D];北方工业大学;2005年
6 童玉媛;税收差异影响下公司股利分配的最优控制研究[D];重庆大学;2005年
7 李蓬;轻度混合动力电动汽车制动能量回收控制策略仿真[D];清华大学;2005年
8 王水林;等体积明渠的鲁棒控制[D];武汉大学;2004年
9 李坤龙;确定性传染病模型的最优接种控制策略研究[D];电子科技大学;2011年
10 张治刚;一类非线性退化方程的最优控制问题[D];东北师范大学;2002年
中国重要报纸全文数据库 前10条
1 ;我校获2008年度国家科技奖成果简介[N];新清华;2009年
2 本报记者 姚雷;公司信息化工程建设实现成本最优控制[N];国家电网报;2009年
3 山东省德州市审计局 张振中;控制论在审计中的应用[N];中国审计报;2008年
4 熊燕;第27届中国控制会议在昆召开[N];云南日报;2008年
5 姚洪贵 袁晓梅;四院科技公司 成本工程建设实现成本最优控制[N];中国航天报;2010年
6 许淑惠;玻璃包装工业的战略调整与研发方向[N];中国包装报;2005年
7 省广播电影电视总台 赵之先;我省广播影视集团化改革中财务管理存在的问题及对策[N];甘肃经济日报;2005年
8 ;煤炭业:在慢火中升温[N];电脑商报;2008年
9 本报记者 顾猛;搏击在电力科研的竞技场[N];中国人事报;2005年
10 丘慧慧;科健、三星划定势力范围 手机“韩流”渐行渐远?[N];21世纪经济报道;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978