收藏本站
《东北大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于近似动态规划的非线性系统最优控制研究

魏庆来  
【摘要】:非线性系统的最优控制一直是控制领域研究的热点和难点之一.近似动态规划自从诞生之日起就一直被认为是解决非线性系统最优控制的有效方法.近似动态规划结合了神经网络,自适应评判设计,加强学习和经典动态规划等理论.由于近似动态规划在求解非线性系统最优控制时成功避免了“维数灾”问题而获得广泛的关注.因此,进一步探讨近似动态规划理论及其算法,对更深入的解决非线性系统的最优控制问题有着重要的理论意义和应用价值.本文基于近似动态规划理论与算法,分别对多目标优化系统,跟踪系统,二人零和微分对策以及时滞系统的最优控制进行了深入的研究,取得了如下创新性成果: 1.提出一种新型无模型增量Q-学习方法,解决了在无模型条件下的多目标最优控制问题.通过系统变换,使得带有向量值性能指标函数的多目标动态规划问题转变成标准的带有二次型性能指标函数的动态规划问题.该方法采用状态和控制的增量进行计算,而不是直接计算状态变量和控制变量本身.同时,证明了由该方法得出的最优控制增量满足相应的离散时间代数Riccati方程.应用动态规划的最优性原理,该方法允许评判网络和执行网络在无模型条件下自适应调节权值并最终得到最优控制,同时在理论上证明了性能指标函数的收敛性和系统的稳定性. 2.首次应用贪婪启发式动态规划(HDP)迭代算法解决了非线性系统的最优跟踪控制问题.针对最优跟踪控制问题提出了一种新型的性能指标函数,以达到更好的跟踪效果.文中通过跟踪误差来设计最优跟踪控制,并通过系统变换使得离散时间非线性最优跟踪控制问题转变成最优调节问题.给出严格的数学证明保证了所提出贪婪HDP迭代算法的收敛性. 3.提出了一种新型迭代近似动态规划(ADP)算法,解决了连续时间非线性系统二人零和微分对策问题.通过动态规划理论和微分对策理论,迭代求解出最优控制量,使得性能指标函数达到鞍点.同时通过严格的数学理论证明了求得的最优控制量能够使得系统稳定并使性能指标函数收敛到最优解. 4.针对鞍点不存在条件下的二人零和微分对策问题,通过迭代ADP算法,首次求解出一组确定的控制策略使得性能指标函数达到对策的混合最优解.并且用严格的数学理论证明了所求得的混合最优控制对能够使得系统稳定,并使得性能指标函数收敛到微分对策的混合最优解. 5.基于近似动态规划理论,研究了带有时滞的离散时间仿射非线性系统的最优控制问题.通过引进时滞矩阵函数,获得了时滞系统最优控制的显式表达式.应用迭代ADP算法求解出时滞系统的最优控制和最优性能指标函数,同时给出迭代算法的收敛性证明. 6.针对一类离散时间状态时滞非线性系统,采用一种伪线性化方法—线性时变近似方法,将时滞非线性系统近似成一系列带有时滞的线性系统.根据经典动态规划的基本理论,求解出最优控制并使得最优控制满足相应的离散时间时滞代数Riccati方程.用严格的数学理论证明了系统的稳定性和状态的收敛性.
【学位授予单位】:东北大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:O232

免费申请
【引证文献】
中国期刊全文数据库 前1条
1 李爱娟;李舜酩;赵万忠;沈峘;江星星;邱绪云;王慧君;;基于最优控制理论的智能车辆轨迹生成方法[J];吉林大学学报(工学版);2014年05期
中国硕士学位论文全文数据库 前2条
1 胡洲;基于HDP的一类时滞离散时间非线性系统最优跟踪控制的研究[D];广西大学;2012年
2 曹怒云;基于有限时间ADP算法的状态时滞非线性系统ε-最优控制[D];广西大学;2013年
【共引文献】
中国期刊全文数据库 前10条
1 杨兴江;BP算法的程序实现与改进[J];阿坝师范高等专科学校学报;2002年02期
2 严波;基于自适应控制的微机电流速断保护的研究[J];安徽电气工程职业技术学院学报;2005年01期
3 孔慧芳;王经维;;线性调节器加权矩阵的工程实用逆推算法[J];安徽工学院学报;1990年01期
4 朱中稳;陈建明;;FA型保温补贴的计算机辅助设计[J];安徽工学院学报;1991年02期
5 尹哲;;人参种植的经济分析[J];安徽农业科学;2009年01期
6 包峰;王娟;任振辉;;基于BP网络的葡萄病害发生预测系统的开发研究[J];安徽农业科学;2010年14期
7 王茜;陈雪波;;群体系统稳定性的研究现状及线性时变系统的稳定性判定方法[J];辽宁科技大学学报;2010年05期
8 詹红霞;王秋红;彭勇;;光伏发电系统并网的母线保护研究[J];半导体光电;2012年02期
9 霍建平;多变量自校正解耦控制器及其应用[J];北方工业大学学报;1990年01期
10 刘宇奇,陆一平,查建中,贾凌燕;矩形块划分的二维空间数据挖掘算法及其应用[J];北京交通大学学报;2005年04期
中国重要会议论文全文数据库 前10条
1 兰永红;吴敏;佘锦华;;基于二维混合模型的最优重复控制[A];第二十六届中国控制会议论文集[C];2007年
2 曾宪伟;方洋旺;伍友利;王洪强;刘加丛;;一种新的最优制导律[A];第二十六届中国控制会议论文集[C];2007年
3 武玉强;程丽丽;郑秀云;;有限时间收敛控制与时间最优控制性能指标分析[A];第二十七届中国控制会议论文集[C];2008年
4 曾喆昭;;基于神经元PID最优控制的汽轮机调速系统研究[A];第二十九届中国控制会议论文集[C];2010年
5 ;Disturbance Attenuation and Rejection for Systems with Nonlinearity via Successive Approximation Approach[A];中国自动化学会控制理论专业委员会A卷[C];2011年
6 杜邵龙;周春山;;基于神经网络的膜法薏苡仁油脱胶过程动态模拟和预测[A];膜分离技术在石油和化工行业中应用研讨会论文集[C];2006年
7 闫佳;陈雪波;王莉;;虚拟企业伙伴选择过程以及方法研究[A];先进制造技术论坛暨第五届制造业自动化与信息化技术交流会论文集[C];2006年
8 曾昭振;;打叶复烤线润叶机监控系统的设计与应用[A];2010年西南三省一市自动化与仪器仪表学术年会论文集[C];2010年
9 张天林;陈洪波;王斌;;宣钢三高线加热炉自动控制系统的应用[A];2009年河北省轧钢技术与学术年会论文集(下)[C];2009年
10 刘伟;王桂坤;;应用BP神经网络技术评价矿井通风系统[A];2007年山东省制冷空调学术年会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 侯婷;离散时间Markov跳变系统的稳定性与鲁棒H_2/H_∞控制[D];山东科技大学;2010年
2 谭佳琳;粒子群优化算法研究及其在海底地形辅助导航中的应用[D];哈尔滨工程大学;2010年
3 梁燕军;海洋平台非线性系统最优减振控制研究[D];中国海洋大学;2010年
4 张进;地震叠前数据的弹性阻抗非线性反演方法研究[D];中国海洋大学;2009年
5 张城明;非线性时滞系统最优控制及在海洋平台减振控制中的应用研究[D];中国海洋大学;2010年
6 朱松;随机回归神经网络的动力学行为研究[D];华中科技大学;2010年
7 刘津甦;复杂环境中的人形机器人行走规划[D];中国科学技术大学;2010年
8 陈江辉;Buck型逆变器高阶系统布尔型滑模控制及反馈线性化最优控制研究[D];华南理工大学;2010年
9 王晓东;双机架紧凑式炉卷轧机模型自适应优化控制[D];昆明理工大学;2008年
10 赵明;斜拉索随机最优主动/半主动控制[D];浙江大学;2011年
中国硕士学位论文全文数据库 前10条
1 邢著荣;基于辐射传输模型和CHRIS数据反演春小麦LAI[D];山东科技大学;2010年
2 陈少华;基于Hopfield神经网络控制系统的研究[D];山东科技大学;2010年
3 许继影;一类非线性时滞系统的稳定性及鲁H_∞控制[D];广西师范学院;2010年
4 王芳;核动力装置运行虚拟仿真及控制[D];哈尔滨工程大学;2010年
5 张宁;直线倒立摆起摆与稳摆控制的优化与改进[D];大连理工大学;2010年
6 张雪;基于变论域自适应模糊控制理论的三级倒立摆控制器的研究[D];大连理工大学;2010年
7 苌占波;咀嚼机器人建模与控制研究[D];大连理工大学;2010年
8 蔡磊;模糊控制在矿井提升机调速系统中的应用[D];辽宁工程技术大学;2009年
9 张艳;基于模糊神经网络的集中供热负荷预测[D];辽宁工程技术大学;2009年
10 刘旭旺;全局优化理论几种算法的改进与研究[D];辽宁工程技术大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 林小峰;杨晓娜;黄清宝;宋春宁;;基于ADP的一类时滞离散系统跟踪控制[J];广西大学学报(自然科学版);2011年06期
2 孙凤琪;;时变不确定时滞系统的稳定性分析[J];吉林大学学报(信息科学版);2012年05期
3 ;Trajectory planning and yaw rate tracking control for lane changing of intelligent vehicle on curved road[J];Science China(Technological Sciences);2011年03期
4 高兴泉;马苗苗;陈虹;;考虑时域硬约束的T-S模糊系统最优控制[J];吉林大学学报(工学版);2007年03期
5 郑再东;崔宝同;;一类广义不确定时滞系统的鲁棒容错控制[J];计算机应用研究;2012年04期
6 唐功友;李超;高洪伟;;线性时滞系统基于观测器的最优输出跟踪控制器近似设计[J];控制理论与应用;2008年01期
7 林小峰;黄元君;宋春宁;;带ε误差限的近似最优控制[J];控制理论与应用;2012年01期
8 ;Approximate Dynamic Programming for Self-Learning Control[J];自动化学报;2005年01期
9 ;Performance Potential-based Neuro-dynamic Programming for SMDPs[J];自动化学报;2005年04期
10 谭述君;钟万勰;;非线性最优控制系统的保辛摄动近似求解[J];自动化学报;2007年09期
中国博士学位论文全文数据库 前1条
1 王海红;离散时滞非线性系统最优控制的逐次逼近设计及应用[D];中国海洋大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 张锁春;一种最优控制数值计算方法[J];计算物理;1988年04期
2 王孝红;;线性时延系统用Hermite正交多项式的最优控制[J];济南大学学报(自然科学版);1988年03期
3 刘晓华;具有投资滞后动态投入产出模型及其最优控制[J];烟台师范学院学报(自然科学版);1990年02期
4 齐维贵;用相平面法设计最速开关线[J];哈尔滨建筑大学学报;1991年04期
5 董继学,张虹;Riccati方程的新解法及其在最优控制中的应用[J];黑龙江八一农垦大学学报;2004年03期
6 唐万生,赵胜民,李光泉,郑丕谔;连续边界条件系统的最优控制[J];系统工程学报;1997年01期
7 张万奎;;城市道路照明降压节电技术[J];湖南理工学院学报(自然科学版);2006年02期
8 蔡其发;黄思训;项杰;兰伟仁;;几个典型台风路径的同化试验(英文)[J];海洋通报(英文版);2006年02期
9 田巍;张贵来;王辉;;具有内部构造安全保障体系的冗余机器系统稳态解的最优控制[J];数学的实践与认识;2007年20期
10 刘东焕;赵立纯;于文波;;基于营养动力学的两种群模型的最优控制[J];鞍山师范学院学报;2008年06期
中国重要会议论文全文数据库 前10条
1 韦林;方明霞;;最优控制冷却塔预张力的安全度[A];第九届全国结构工程学术会议论文集第Ⅱ卷[C];2000年
2 张顺宝;;基于神经网络的结构振动最优控制[A];第九届全国结构工程学术会议论文集第Ⅰ卷[C];2000年
3 任玉辉;张涛;孟庆华;柏庆岩;张东平;王云川;;轧钢加热炉加热过程最优控制与智能系统的开发与应用[A];2004全国能源与热工学术年会论文集(2)[C];2004年
4 孙亮;樊铭渠;;一类仿射非线性系统的最优控制:改进逐次逼近法[A];第二十七届中国控制会议论文集[C];2008年
5 叶建斌;郭鸿武;;三级倒立摆的LQG最优控制应用研究[A];中南六省(区)自动化学会第二十九届学术年会论文集[C];2011年
6 鲁守银;刘晓平;;非线牲不确定系统的鲁棒最优控制[A];1994年中国控制会议论文集[C];1994年
7 高越农;;作为整体最优控制必要条件及邻域最优控制充分条件的极小值原理[A];1997年中国控制会议论文集[C];1997年
8 廖福成;姜春梅;;用扩大误差系统法同时处理目标值预见与干扰预见[A];1997中国控制与决策学术年会论文集[C];1997年
9 张平;陈宗基;;基于伪逆法的自修复飞控系统的控制律重构[A];1995年中国控制会议论文集(下)[C];1995年
10 司徒荣;;Hilbert空间中随机微分方程的强解与按轨道最优控制[A];1996年中国控制会议论文集[C];1996年
中国重要报纸全文数据库 前10条
1 ;我校获2008年度国家科技奖成果简介[N];新清华;2009年
2 本报记者 姚雷;公司信息化工程建设实现成本最优控制[N];国家电网报;2009年
3 山东省德州市审计局 张振中;控制论在审计中的应用[N];中国审计报;2008年
4 熊燕;第27届中国控制会议在昆召开[N];云南日报;2008年
5 姚洪贵 袁晓梅;四院科技公司 成本工程建设实现成本最优控制[N];中国航天报;2010年
6 许淑惠;玻璃包装工业的战略调整与研发方向[N];中国包装报;2005年
7 ;煤炭业:在慢火中升温[N];电脑商报;2008年
8 省广播电影电视总台 赵之先;我省广播影视集团化改革中财务管理存在的问题及对策[N];甘肃经济日报;2005年
9 本报记者 顾猛;搏击在电力科研的竞技场[N];中国人事报;2005年
10 丘慧慧;科健、三星划定势力范围 手机“韩流”渐行渐远?[N];21世纪经济报道;2003年
中国博士学位论文全文数据库 前10条
1 李搏;主部系数含控制的偏微分方程最优控制[D];复旦大学;2011年
2 翟金刚;基于并行的切换最优控制与混杂动力系统辨识[D];大连理工大学;2013年
3 孟庆欣;有跳跃的随机系统的最优控制[D];复旦大学;2010年
4 肖华;部分信息下正倒向随机系统的最优控制和微分对策理论[D];山东大学;2011年
5 赵瑞艳;具有切换结构的非线性系统最优控制方法研究[D];中国石油大学;2011年
6 高彩霞;非线性脉冲动力系统的最优控制及应用[D];大连理工大学;2005年
7 刘昌贵;注气提高石油采收率最优控制的理论、方法和实现[D];西南石油学院;2002年
8 刘重阳;非线性切换动力系统的最优控制及应用[D];大连理工大学;2010年
9 张城明;非线性时滞系统最优控制及在海洋平台减振控制中的应用研究[D];中国海洋大学;2010年
10 夏小虎;时变最优控制与直升机软着陆应用研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 孙亮;非线性大系统最优控制:逐次逼近法[D];中国海洋大学;2004年
2 李双增;一类脉冲微分系统的最优控制[D];哈尔滨工业大学;2010年
3 杨佩佩;双线性系统近似最优控制方法的研究[D];青岛科技大学;2010年
4 陶格;基于模糊控制的两级倒立摆的研究[D];北方工业大学;2005年
5 童玉媛;税收差异影响下公司股利分配的最优控制研究[D];重庆大学;2005年
6 李蓬;轻度混合动力电动汽车制动能量回收控制策略仿真[D];清华大学;2005年
7 王水林;等体积明渠的鲁棒控制[D];武汉大学;2004年
8 徐永锋;随机中立型微分动力系统的最优控制[D];广州大学;2010年
9 李坤龙;确定性传染病模型的最优接种控制策略研究[D];电子科技大学;2011年
10 张治刚;一类非线性退化方程的最优控制问题[D];东北师范大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026