收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

时标随机最优控制问题

朱英俊  
【摘要】:为了统一处理连续时间问题和离散时间问题,1988年,Hilger在他的博士论文中创建了 Time Scales(以下称为时标)理论。在此之后,时标理论凭借其优良的时间结构特性及广阔的应用前景,得到了人们的持续关注及深入研究。现实中有许多过程的时间变量既不是经典的连续时间,也不是均匀离散时间,例如,一个由电阻、电容及自感线圈所组成的简单串联电路,当电容以固定频率作周期闭合时,电路中电流的变化率正好可以用时标上的导数来描述。时标理论所定义的时间尺度适用范围更广,可行性更强,近年来受到了广泛关注。同时,实际控制系统都带有随机因素,在很多情况下,这些因素不可忽略。因此,研究时标框架下的随机最优控制问题具有重要意义,尤其是处理时间变量结构复杂的问题。本文首次较为深入和系统地在时标体系下研究随机Δ-微分系统的最优控制问题。相比于经典连续时间和离散时间情形,时标最优控制问题的研究,不仅有助于统一建立包含连续时间和离散时间情形在内的最优控制理论,从而避免连续时间和离散时间之间的重复性研究以及更好地了解这两类不同系统之间的区别及联系,而且对实际优化问题中遇到的时间尺度既包含连续时间区间又包含离散时间孤立点集的动力控制系统提供一定的理论指导。我们主要研究了两类随机最优控制问题,一类是时标随机线性系统的最优控制问题,分别研究了随机线性二次最优控制问题和平均场型随机线性二次最优控制问题。另一类是时标非线性随机系统的最优控制问题,建立了动态规划原理和最大值原理。关于本文的主要内容,概要如下:第一章,主要就本论文所涉及问题的研究背景及研究内容展开深入介绍。第二章,主要介绍时标理论体系的有关内容,为后面研究内容做数学准备。第三章,由时标随机线性控制系统出发,探讨二次型代价泛函的最优控制问题。为解决此问题,在时标体系下建立了关于随机过程的乘积法则,且通过完全平方方法引入Riccati Δ-微分方程(RΔE)及一个辅助的线性方程,在一定条件下,给出了最优控制的线性反馈形式。受此启发,进一步研究了时标平均场随机线性二次最优控制问题。相较于已有的时标最优控制问题所不同的是,控制系统及代价泛函中均包含状态和控制的期望项。针对状态方程,用迭代法证明了其解的存在唯一性。通过耦合RΔEs的解,给出了该问题最优控制的反馈表达形式。另外,我们对RΔEs解的存在唯一性问题进行了讨论,并给出了 RΔEs可解性的充要条件。第四章,我们研究了随机非线性Δ-微分系统最优控制问题的动态规划原理。为解决该问题,在时标体系下给出了复合函数链式导数的定义并建立了多元函数的链式法则。以此为基础,重建了关于时标随机过程的伊藤公式,进而借助伊藤公式得到随机最优控制问题的最优性原理和值函数满足的Hamilton-Jacobi-Bellman(HJB)方程。值得注意的是,本文得到的HJB方程比以往研究中出现的相关HJB方程,在形式上要更加复杂,其是一个带期望的二阶偏Δ-微分方程,原因是离散点出现的时间间断导致此方程包含期望。进一步,将所得时标动态规划原理的结果应用在时标随机线性二次最优控制问题的研究中。第五章,考虑了两类时标随机非线性控制系统,并分别给出了对应的最大值原理。一类是随机Δ-微分系统的最优控制问题。在假设控制域是凸集的情况下,通过乘积法则建立对偶关系,从而推导出伴随方程的合适形式,进一步利用变分法并给出时标最优控制问题的最大值原理。其结果退化到离散时间情形下,形式上与传统离散时间情形的结果并不一致,针对这种不一致现象,我们分析并证明了两种结果的等价性。此外,给出了所得时标随机最大值原理在时标随机线性二次最优控制问题中的应用。另一类是受控系统由一个带有条件期望的随机Δ-微分方程(SΔE)给出。我们先由迭代法给出了此类SΔE解的存在唯一性,相较于已有的此类方程的结果,我们研究的方程包含更复杂的条件期望项。用凸变分方法给出了控制系统的变分方程以及一些相关估计,这就使得我们可以推导出变分不等式。随后,利用对偶关系给出了变分不等式其等价形式的伴随方程,借助变分不等式的等价形式及其等价形式的伴随方程,本文就得到了最优控制满足的必要条件—最大值原理,其结果退化到离散时间情形下,也是一个新的结果。第六章,我们将得到的理论结果应用于金融数学问题和季节性种群模型。在金融数学中的一个基本问题是投资策略的构建,其中均值-方差投资组合模型是一类被广泛研究的投资策略。对经典连续时间和离散时间的均值-方差投资组合模型,重构在时标体系下的模型。季节性蚊虫数量的变化规律兼具连续和离散特征,因此在时标体系下建立蚊虫种群密度的控制模型。结果显示,在休眠期开始时施加脉冲控制能够减少来年蚊虫的种群密度。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孙一芳;穆浩杰;王淑影;;由分数布朗运动驱动的平均场型线性二次随机最优控制问题[J];长春工业大学学报;2020年05期
2 邓国和;杨向群;;一类随机最优控制问题的单调控制解[J];应用数学学报;2008年01期
3 梁宗霞;赵笑阳;;一类含消费、寿险和投资的随机最优控制问题[J];中国科学:数学;2016年12期
4 朱位秋;应祖光;;拟哈密顿系统非线性随机最优控制[J];力学进展;2013年01期
5 吴捷,马裕旭;采用带时滞的输入-输出模型的随机最优控制(英文)[J];控制理论与应用;1989年01期
6 陈金志,涂生;产品回收系统库存容量有限时的随机最优控制研究[J];南开大学学报(自然科学版);2004年04期
7 胡荣春;应祖光;朱位秋;;不确定拟哈密顿系统的随机最优控制[J];动力学与控制学报;2017年01期
8 王攀;包立平;;一类广告的随机最优控制模型的奇摄动解[J];杭州电子科技大学学报(自然科学版);2017年02期
9 黄大荣;杨永琴;;一类新的线性二次随机最优控制器的设计[J];纯粹数学与应用数学;2008年02期
10 张海森;张旭;;随机最优控制的二阶必要条件综述[J];系统科学与数学;2019年02期
11 常业恒;;时标简介[J];中学数学;1993年04期
12 陈永红;;孩子,让我们一起做数学[J];数学大世界(下旬);2017年05期
13 马长林;张清国;;网络化控制系统的随机最优控制[J];清华大学学报(自然科学版);2008年S2期
14 王时标,姚振兴;The research on the space-time coherence of Xianshuihe fault zone in the process of seismogeny[J];Acta Seismologica Sinica(English Edition);1997年06期
15 隗寒冰;秦大同;陈淑江;;重度混合动力汽车油耗和排放的多目标随机最优控制策略[J];汽车工程;2014年08期
16 李杰;彭勇波;;基于广义密度演化方程的结构随机最优控制[J];计算力学学报;2010年06期
17 李志涛;王光臣;林超;;一类随机最优控制问题的局部必要条件及在投资选择中的应用[J];山东大学学报(理学版);2007年06期
18 戚小进;李勇;;两种程控时标产生技术的分析[J];计量技术;1992年03期
19 陈铁军,杜明全;多时标链预估系统[J];控制与决策;1993年01期
20 苏波;;《文学时标》复刊[J];世界文学;1987年04期
中国重要会议论文全文数据库 前20条
1 应祖光;王永;朱位秋;;拟哈密顿系统非线性随机最优控制的鲁棒性[A];第十一届全国非线性振动学术会议暨第八届全国非线性动力学和运动稳定性学术会议论文摘要集[C];2007年
2 应祖光;王永;朱位秋;;拟哈密顿系统非线性随机最优控制的鲁棒性[A];第十一届全国非线性振动学术会议暨第八届全国非线性动力学和运动稳定性学术会议论文集[C];2007年
3 朱位秋;;拟哈密顿系统非线性随机最优控制研究的若干进展[A];第八届全国动力学与控制学术会议论文集[C];2008年
4 宦荣华;朱位秋;;计及执行器饱和的滞迟系统的非线性随机最优控制[A];第九届全国振动理论及应用学术会议论文摘要集[C];2007年
5 茅僰;应祖光;朱位秋;;不确定性结构系统非线性随机最优控制的鲁棒性[A];第九届全国振动理论及应用学术会议论文摘要集[C];2007年
6 彭勇波;陈建兵;李杰;;平稳激励滞回系统随机最优控制[A];第二届全国随机动力学学术会议摘要集与会议议程[C];2013年
7 汤善健;雍炯敏;;有限时区上的随机最优转换和脉冲控制[A];1992年控制理论及其应用年会论文集(下)[C];1992年
8 王永;;加速度参激系统的非线性随机最优控制[A];第二届全国随机动力学学术会议摘要集与会议议程[C];2013年
9 戴浩晖;汪志鸣;;基于模型的网络化控制两时标系统的稳定性分析[A];2009年中国智能自动化会议论文集(第三分册)[C];2009年
10 吕炳楠;周善贵;赵恩广;;基于相对论平均场模型系统研究原子核裂变位垒[A];第十四届全国核物理大会暨第十届会员代表大会论文集[C];2010年
11 潘峰;;严格可解的平均场加对力模型综述[A];第十次全国核结构研讨会暨第六次全国核结构专题讨论会会议文集(二)[C];2004年
12 岳猛;么莉;刘建功;刘鲁源;;随机最优控制与自适应控制的并行结构[A];1996年中国控制会议论文集[C];1996年
13 李静强;;动态规划在物流企业中的配送与运输问题分析[A];2019全国教育教学创新与发展高端论坛论文集(卷十一)[C];2019年
14 曹东旭;武思军;;动态规划在最小化平均对抗成本问题中的应用[A];2019第七届中国指挥控制大会论文集[C];2019年
15 王永;应祖光;朱位秋;;基于极大值原理的拟Hamilton系统的非线性随机最优控制[A];第九届全国动力学与控制学术会议会议手册[C];2012年
16 胡乐群;吴沧浦;;矢量指标动态规划的满意解方法[A];全国青年管理科学与系统科学论文集(第1卷)[C];1991年
17 罗一平;;特殊时标动力学系统方法及其应用[A];第十六届全国交叉科学会议论文摘要集[C];2016年
18 谢永亮;;动态规划在振动结构反问题中的应用[A];第八届和第九届全国振动与噪声技术交流会论文集[C];1995年
19 宋绍剑;李劲芝;林小峰;;基于执行依赖启发式动态规划的三容水槽液位控制[A];第二十七届中国控制会议论文集[C];2008年
20 周善贵;;原子核结构的相对论平均场描述[A];第十次全国核结构研讨会暨第六次全国核结构专题讨论会会议文集(一)[C];2004年
中国博士学位论文全文数据库 前20条
1 朱英俊;时标随机最优控制问题[D];山东大学;2021年
2 Patrick Kandege Mwanakatwe;养老金可持续性的随机最优控制策略[D];大连理工大学;2019年
3 马玲玲;基于模型约化方法的随机最优控制问题的研究[D];湖南大学;2020年
4 宦荣华;计及执行器饱和的拟哈密顿系统的非线性随机最优控制[D];浙江大学;2007年
5 浦江燕;资产定价,稳健投资与随机最优控制的动态规划[D];复旦大学;2013年
6 路晓东;几类时标系统的稳定性分析与镇定控制[D];山东大学;2019年
7 郝涛;平均场正倒向随机微分方程及相关的最优控制、微分对策问题[D];山东大学;2016年
8 李志鹏;任意个数自主体平均场线性二次最优控制问题研究[D];山东大学;2018年
9 孙亚兵;平均场正倒向随机微分方程的数值解法研究[D];山东大学;2019年
10 蔡玉杰;平均场随机微分系统的最优控制和大偏差[D];武汉大学;2013年
11 阴佳腾;基于近似动态规划的城轨列车运行一体化调整方法研究[D];北京交通大学;2018年
12 李冰;概周期时标理论及若干应用研究[D];云南大学;2016年
13 王维峰;随机最优控制问题必要条件及其相关问题的研究[D];华中科技大学;2013年
14 郝茵茵;相依死亡率模型下长寿债券定价问题的若干研究[D];武汉大学;2019年
15 闵慧;受控的平均场随机系统[D];山东大学;2016年
16 Basimanebotlhe Othusitse;随机最优控制在养老基金和微分对策论中的应用[D];哈尔滨工业大学;2015年
17 孙景云;养老基金管理中的随机最优控制问题研究[D];兰州大学;2016年
18 田绍琳;脉冲、奇异型随机最优控制研究及其应用[D];北京交通大学;2013年
19 连传强;基于近似动态规划的优化控制方法及在自主驾驶车辆中的应用[D];国防科学技术大学;2016年
20 李瑞敬;平均场随机系统最优控制及其相关问题研究[D];华中科技大学;2015年
中国硕士学位论文全文数据库 前20条
1 滕飞;带终端约束的部分信息随机最优控制问题的最大值原理及应用[D];山东大学;2011年
2 万鹤翔;不完备信息下带约束的随机最优控制问题及其应用[D];山东大学;2021年
3 陈庆医;基于参考端时标信号诊断和多数据融合的NIMDO系统改进[D];北京交通大学;2019年
4 蔡金香;几类时标网络模型的动力学研究[D];集美大学;2015年
5 王博宇;几类时标网络模型的动力学分析[D];集美大学;2017年
6 娄延俊;平均场倒向随机微分方程的线性二次最优控制及非零和微分对策[D];山东大学;2013年
7 孙子龙;带终端限制的一类随机最优控制问题的最大值原理[D];山东大学;2010年
8 冀鹏飞;约束平均场线性二次最优控制问题的研究[D];山东科技大学;2018年
9 王孟哲;超密集网络中基于平均场理论的资源分配研究[D];北京邮电大学;2019年
10 张素素;平均场一主二从线性二次随机微分博弈[D];山东大学;2019年
11 于鑫;具有模型不确定性与乘性噪声的线性二次平均场社会控制研究[D];山东大学;2019年
12 唐文佳;随机条件下的平均场倒向随机微分方程[D];山东大学;2018年
13 王佳琦;原子核非晕态的投影后变分方法[D];吉林大学;2018年
14 颜浩;平方增长的平均场倒向随机微分方程[D];山东大学;2015年
15 杜蘅;平均场倒向随机微分方程的性质及应用[D];山东大学;2012年
16 张治安;基于Riccati方程的非线性微分方程并行求解及在线方程知识库的研发[D];华东师范大学;2017年
17 张少鹏;平均场博弈模型及其在港口煤炭企业中的应用研究[D];燕山大学;2016年
18 张晓;一般情形的平均场倒向随机微分方程[D];山东大学;2017年
19 刘嘉航;基于近似动态规划的自学习控制方法及应用研究[D];国防科技大学;2017年
20 宋方杨;基于动态规划的特殊地区工程项目工期—费用优化研究[D];西华大学;2018年
中国重要报纸全文数据库 前5条
1 北京商报记者 肖海燕;跨境ETF再现 博时标普500ETF发行[N];北京商报;2013年
2 张宏斌;农金供需双方需提升动态规划能力[N];金融时报;2018年
3 彭舒佳;专家吁建动态规划机制“纠编”用地[N];中国房地产报;2008年
4 张柏中;时标网络计划在施工中的应用[N];建筑时报;2006年
5 特约记者 苏橹萱;我国学者建立西南地区50万年来标准时标序列[N];中国国土资源报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978