收藏本站
收藏 | 论文排版

基于近似动态规划的非线性系统最优控制研究

魏庆来  
【摘要】:非线性系统的最优控制一直是控制领域研究的热点和难点之一.近似动态规划自从诞生之日起就一直被认为是解决非线性系统最优控制的有效方法.近似动态规划结合了神经网络,自适应评判设计,加强学习和经典动态规划等理论.由于近似动态规划在求解非线性系统最优控制时成功避免了“维数灾”问题而获得广泛的关注.因此,进一步探讨近似动态规划理论及其算法,对更深入的解决非线性系统的最优控制问题有着重要的理论意义和应用价值.本文基于近似动态规划理论与算法,分别对多目标优化系统,跟踪系统,二人零和微分对策以及时滞系统的最优控制进行了深入的研究,取得了如下创新性成果: 1.提出一种新型无模型增量Q-学习方法,解决了在无模型条件下的多目标最优控制问题.通过系统变换,使得带有向量值性能指标函数的多目标动态规划问题转变成标准的带有二次型性能指标函数的动态规划问题.该方法采用状态和控制的增量进行计算,而不是直接计算状态变量和控制变量本身.同时,证明了由该方法得出的最优控制增量满足相应的离散时间代数Riccati方程.应用动态规划的最优性原理,该方法允许评判网络和执行网络在无模型条件下自适应调节权值并最终得到最优控制,同时在理论上证明了性能指标函数的收敛性和系统的稳定性. 2.首次应用贪婪启发式动态规划(HDP)迭代算法解决了非线性系统的最优跟踪控制问题.针对最优跟踪控制问题提出了一种新型的性能指标函数,以达到更好的跟踪效果.文中通过跟踪误差来设计最优跟踪控制,并通过系统变换使得离散时间非线性最优跟踪控制问题转变成最优调节问题.给出严格的数学证明保证了所提出贪婪HDP迭代算法的收敛性. 3.提出了一种新型迭代近似动态规划(ADP)算法,解决了连续时间非线性系统二人零和微分对策问题.通过动态规划理论和微分对策理论,迭代求解出最优控制量,使得性能指标函数达到鞍点.同时通过严格的数学理论证明了求得的最优控制量能够使得系统稳定并使性能指标函数收敛到最优解. 4.针对鞍点不存在条件下的二人零和微分对策问题,通过迭代ADP算法,首次求解出一组确定的控制策略使得性能指标函数达到对策的混合最优解.并且用严格的数学理论证明了所求得的混合最优控制对能够使得系统稳定,并使得性能指标函数收敛到微分对策的混合最优解. 5.基于近似动态规划理论,研究了带有时滞的离散时间仿射非线性系统的最优控制问题.通过引进时滞矩阵函数,获得了时滞系统最优控制的显式表达式.应用迭代ADP算法求解出时滞系统的最优控制和最优性能指标函数,同时给出迭代算法的收敛性证明. 6.针对一类离散时间状态时滞非线性系统,采用一种伪线性化方法—线性时变近似方法,将时滞非线性系统近似成一系列带有时滞的线性系统.根据经典动态规划的基本理论,求解出最优控制并使得最优控制满足相应的离散时间时滞代数Riccati方程.用严格的数学理论证明了系统的稳定性和状态的收敛性.


知网文化
【相似文献】
中国期刊全文数据库 前17条
1 梅俊;顾和平;;基于自适应动态规划的非线性系统最优采样控制[J];中南民族大学学报(自然科学版);2022年02期
2 王耀南;基于神经网络的非线性最优控制[J];湖南大学学报(自然科学版);1995年05期
3 刘华,黄田,曾子平;基于神经网络的一类非线性系统参数估计[J];天津大学学报;1994年05期
4 李俊民,邢科义,万百五;具有模型和实际差异的非线性系统最优控制算法及其收敛性(英文)[J];控制理论与应用;1999年03期
5 王俊,季海波,奚宏生,陈志福;严格反馈非线性系统的自适应逆最优控制[J];中国科学技术大学学报;2002年06期
6 胡云安,晋玉强,张友安,崔平远;基于神经网络的严反馈块非线性系统的鲁棒控制[J];控制与决策;2004年07期
7 张新良;郭晓迪;朱琳;;基于神经网络的时滞非线性系统的广义预测控制[J];测控技术;2017年02期
8 涂庆伟;;一类非线性系统神经网络鲁棒控制方法[J];山东工业技术;2017年18期
9 缪应锋;姚庆华;李智雄;宋晓轩;;基于梯度估计的非线性系统最优控制及仿真[J];计算机系统应用;2016年11期
10 施阳,徐德民,严卫生,任章;一类不确定性非线性系统的神经网络稳定控制[J];西北工业大学学报;1998年03期
11 唐涧涛,佟绍成;基于神经网络的一类非线性系统自适应H~∞控制[J];控制与决策;1999年04期
12 黄永安,邓子辰;基于瞬时最优控制神经网络的建筑结构主动控制研究[J];振动与冲击;2005年02期
13 史国栋,王其红,薛国新,徐燕;RBF神经网络用于系统的预测最优控制[J];石油化工高等学校学报;1999年02期
14 张日东;王树青;;基于神经网络的非线性系统预测函数控制[J];控制理论与应用;2007年06期
15 刘贺平,张兰玲,孙一康;基于多层局部回归神经网络的多变量非线性系统预测控制[J];控制理论与应用;2001年02期
16 李树荣,李峰;基于神经网络的非线性系统在线自校正控制及其应用[J];石油大学学报(自然科学版);1998年04期
17 孙红兵;李生权;;通用神经网络非线性系统模型参考自适应控制[J];计算机应用研究;2009年11期
中国重要会议论文全文数据库 前20条
1 王俊;季海波;奚宏生;陈志福;;一类非线性系统的自适应逆最优控制[A];第二十一届中国控制会议论文集[C];2002年
2 韩耀振;周应兵;周风余;;舰船航向非线性系统神经网络变结构控制[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年
3 雍炯敏;;最佳转换与脉冲控制问题[A];1988年控制理论及其应用年会论文集(中)[C];1988年
4 张燕;李维维;梁秀霞;杨鹏;;离散非线性系统的输出反馈控制及其应用[A];2009中国控制与决策会议论文集(1)[C];2009年
5 孙富春;孙增圻;张戎军;;采样非线性系统的神经网络稳定自适应控制[A];1995年中国智能自动化学术会议暨智能自动化专业委员会成立大会论文集(上册)[C];1995年
6 洪奕光;秦化淑;;非线性系统的无源性与最优性[A];1992年控制理论及其应用年会论文集(上)[C];1992年
7 朴世扬;杨煜普;;一种基于神经网络的非线性模型参考自适应控制方法[A];中国计量协会冶金分会2015年会论文集[C];2015年
8 王飞;张天平;施枭铖;;随机严格反馈非线性系统的自适应神经网络控制[A];中国自动化学会控制理论专业委员会C卷[C];2011年
9 刘英玉;申东日;陈义俊;李蓉;;基于模块化神经网络的非线性系统动态建模[A];2006中国控制与决策学术年会论文集[C];2006年
10 沈栋;陈翰馥;;一类非线性系统的迭代学习控制[A];第二十七届中国控制会议论文集[C];2008年
11 张维韬;冯德兴;;奇异最优控制的渐近分析和一个未解决问题[A];1991年控制理论及其应用年会论文集(下)[C];1991年
12 时贞军;王长钰;;洗煤过程控制中的最优控制模型及求解方法[A];复杂巨系统理论·方法·应用——中国系统工程学会第八届学术年会论文集[C];1994年
13 吴庆林;陈宗海;董道毅;;量子最优控制研究综述[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
14 梁治安;叶庆凯;;多目标最优控制研究[A];1998年中国控制会议论文集[C];1998年
15 尹翔康;吴冲锋;;带随机参数线性系统的最优控制(Ⅱ):控制矩阵是确定性矩阵[A];全国青年管理科学与系统科学论文集(第2卷)[C];1993年
16 朱广生;刘瑞林;;用神经网络建立孔隙度预测模型[A];1992年中国地球物理学会第八届学术年会论文集[C];1992年
17 王晓琳;伍海华;;遗传算法和神经网络在汇率预测中的应用[A];2006中国控制与决策学术年会论文集[C];2006年
18 张宝中;王学智;;一种新的非线性系统建模算法[A];'99系统仿真技术及其应用学术交流会论文集[C];1999年
19 王恩平;;广义离散线性系统的二次最优控制[A];1990年控制理论及其应用年会论文集(1)[C];1990年
20 王秀红;刘梦良;;平方可积扰动下线性系统二次鲁棒最优控制[A];第二十六届中国控制会议论文集[C];2007年
中国博士学位论文全文数据库 前20条
1 魏庆来;基于近似动态规划的非线性系统最优控制研究[D];东北大学;2009年
2 张勇威;基于自适应评判设计的非线性系统事件触发控制方法研究[D];广东工业大学;2021年
3 宋睿卓;基于自适应动态规划的几类非线性时滞系统最优化控制方法研究[D];东北大学;2011年
4 王子洋;非线性系统事件触发自适应动态规划理论与方法研究[D];北京科技大学;2020年
5 屈秋霞;几类不确定非线性系统的自适应动态规划理论研究及其应用[D];东北大学;2018年
6 崔黎黎;基于神经网络的近似动态规划理论及其应用研究[D];东北大学;2011年
7 姜河;基于自适应动态规划的非线性控制理论与优化方法的研究[D];东北大学;2019年
8 罗艳红;基于神经网络的非线性系统自适应优化控制研究[D];东北大学;2008年
9 刘畅;受限离散非线性系统的有限时间估计与同步[D];广东工业大学;2022年
10 肖戈扬;基于自适应动态规划理论的仿射非线性系统最优控制[D];东北大学;2018年
11 石静;基于自适应动态规划的非线性系统最优控制及其在微电网中的应用[D];南京邮电大学;2020年
12 胡荣春;谐和与宽带随机激励综合作用下多自由度非线性系统最优控制理论方法研究[D];浙江大学;2014年
13 郑玉卿;参数未知非线性系统的数据驱动控制研究[D];天津大学;2020年
14 任玲;基于强化学习的非线性系统优化控制研究[D];天津大学;2020年
15 唐丽;基于神经网络与模糊的切换非线性系统的自适应控制[D];东北大学;2018年
16 赵杰梅;离散非线性系统的预测控制方法研究[D];哈尔滨工程大学;2013年
17 孙刚;不确定下三角非线性系统自适应控制[D];大连海事大学;2013年
18 杨文贵;几类高阶和忆阻神经网络的稳定性和同步研究[D];东南大学;2020年
19 王彩成;严格反馈非线性系统的容错和事件触发控制方法研究[D];东北大学;2018年
20 姚赛;两类新型神经网络及其在非线性系统控制中的应用[D];东北石油大学;2015年
中国硕士学位论文全文数据库 前20条
1 吕永峰;基于近似动态规划的连续非线性系统最优控制及应用[D];昆明理工大学;2016年
2 罗芳超;基于自适应动态规划的非线性系统事件触发容错控制[D];广东工业大学;2021年
3 林浩伟;基于粒子群优化评判网络的未知非线性系统容错控制[D];广东工业大学;2020年
4 刘浠;基于粒子群神经网络的非线性系统容错控制方法[D];广东工业大学;2021年
5 徐浩翔;具有输出约束的严格反馈非线性系统自适应最优控制研究[D];扬州大学;2020年
6 金薇;具有传输时延与数据包丢失的网络化控制系统的最优控制[D];广东工业大学;2016年
7 范思嘉;基于自适应动态规划的非线性系统容错控制[D];哈尔滨工业大学;2020年
8 范伟;基于RBF神经网络的非线性系统控制算法研究[D];河北工业大学;2013年
9 王静远;非线性系统神经网络自适应控制及其在锅炉控制中的应用[D];河北科技大学;2018年
10 刘华超;基于自适应动态规划的天然气脱硫过程控制方法研究[D];重庆科技学院;2019年
11 孟凡华;模糊神经网络在大滞后非线性系统中的应用[D];河北工业大学;2004年
12 赖家伦;基于深度神经网络的AGV实时最优控制[D];广东工业大学;2021年
13 李春华;基于神经网络的非线性系统自适应控制研究[D];南京信息工程大学;2008年
14 廖凯举;基于迭代神经动态规划的优化控制研究[D];天津大学;2020年
15 季楠;非线性系统的输入饱和控制研究[D];江南大学;2017年
16 黄振凯;船舶航向最优化控制设计[D];大连海事大学;2016年
17 赵玉卓;具有未建模动态非线性系统的自适应神经网络控制[D];渤海大学;2021年
18 周书清;基于神经网络的系统辨识与控制[D];华北电力大学(北京);2017年
19 王飞;随机严格反馈非线性系统的自适应神经网络控制[D];扬州大学;2012年
20 王晓琳;遗传算法与神经网络在汇率预测中的应用[D];青岛大学;2006年
中国重要报纸全文数据库 前20条
1 记者 张梦然;神经网络打开理解电子相互作用新窗口[N];科技日报;2021年
2 记者 董映璧;神经网络技术检测玻璃钢缺陷精度高[N];科技日报;2020年
3 湖北日报全媒记者 张爱虎 通讯员 徐向军 实习生 于蓝;一群“90后”率先建成铁路“神经网络”[N];湖北日报;2019年
4 记者 刘霞;忆阻器制成神经网络更高效[N];科技日报;2017年
5 整理 本报记者 诸玲珍 顾鸿儒;微软神经网络切割法可使加速作用超线性[N];中国电子报;2018年
6 ;神经网络小史[N];电子报;2018年
7 ;人工智能将取得大面积突破[N];中国企业报;2017年
8 本报记者 龚丹韵;人机大战:人类还有优势吗[N];解放日报;2017年
9 ;人类正迎来云端机器人时代[N];中国企业报;2017年
10 记者 邱智丽;AI竞赛 中国力量崛起[N];第一财经日报;2017年
11 记者 刘霞;新神经网络使计算机像人一样推理[N];科技日报;2017年
12 本报记者 喻思娈;人工智能有多智能?[N];人民日报;2017年
13 记者 王雪青;构建机器世界神经网络 东土科技“抄底”人工智能[N];上海证券报;2017年
14 ;人工智能到底有多智能?[N];长白山日报;2017年
15 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年
16 记者 冯海波 通讯员 华轩;构建叠层宽度神经网络成深度模型[N];广东科技报;2021年
17 记者 毛黎;神经网络技术帮自主驾驶汽车识别幻影物体[N];科技日报;2020年
18 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年
19 本报首席记者 任荃 实习生 史博臻;轨交“神经网络”触动创新神经[N];文汇报;2011年
20 记者 张梦然;神经网络完成芯片设计仅需几小时[N];科技日报;2021年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978