收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于强化学习的仿人智能控制器参数在线学习与优化

甘晓琴  
【摘要】: 仿人智能控制基于特征辨识的多控制器、多控制模态结构,其控制的一个显著特点是比例(闭环)和保持(开环)模式的切换,突破了传统控制理论控制信息处理单映射的结构,妥善地解决了稳定性和准确性、快速性之间的矛盾,解决了复杂难控系统的控制可行性问题。但是,由于其多控制器和多控制模态结构,造成特征参数和控制参数众多,给控制器的设计又带来了困难。另外,系统本身因为周围环境的改变而改变或者不确定因素的存在使得控制参数不能在这个运行过程中一成不变,必须要对参数进行实时校正,才能直接用于实际系统。因为对于本论文的研究对象在使用仿人智能控制的同时引入在线参数学习与优化的方法,对于实现快速高品质的实时控制显得十分重要。 参数的在线学习与优化在控制中起着重要的作用,其在线学习与离线学习参数的最大区别是在线学习参数可以适应动态环境,而离线学习参数则只适于静态或简单的环境。在线参数的方法包括:模拟退火算法(SA)、粒子群算法(PSO)、单纯形法和强化学习方法等等。本论文首次提出了利用强化学习在线学习优化仿人智能控制器的参数。 连续动作强化学习自动机(Continuous Action Reinforcement Learning Automata,CARLA)是强化学习中的一种,其具有在参数空间上连续取值。其算法利用连续概率密度函数(Continuous Probability Density Function,CPDF),处理每一个决策变量,通过多次迭代对参数的修正,最终将参数收敛到一个稳定值上,每一次修正的过程都取决于每次迭代后得到的强化信号值。 本文有效地实现了利用连续动作强化学习自动机在线学习具有多模态控制结构和分层递阶结构的仿人智能控制器参数。在文章的最后,选取研究对象,分别实现基于CARLA的仿人智能控制参数在线学习及基于CARLA的PID控制参数在线学习与优化。此外还分别利用遗传算法对系统参数进行寻优与CARLA参数寻优进行对比。结果显示,在不同控制器作用下,仿人智能控制明显优于PID控制;在相同控制器作用下,CARLA在线学习参数明显优于遗传算法寻优参数等其他算法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李劲松;;新型带专家系统的仿人智能控制[J];计算机仿真;1990年03期
2 章兢;仿人智能控制与模糊控制神经网络融合技术[J];控制与决策;1999年05期
3 牛鹏辉,涂亚庆;过程控制中的仿人智能控制算法[J];计算机测量与控制;2005年10期
4 生力松;余达太;李果;姬献征;;车载天线跟踪系统的智能控制[J];计算机测量与控制;2006年02期
5 邹伟,孙瑜,周海君;纸浆浓度的仿人智能PID控制[J];中国造纸;2005年08期
6 蔡凌;韩晓;;基于仿人智能控制的恒温水(油)浴箱温度控制的研究[J];化工自动化及仪表;2011年03期
7 王培进;仿人智能推理与控制器的研究[J];计算机工程与应用;2001年14期
8 陈波,康戈文,涂铭旌;高频感应加热设备仿人智能控制及其仿真[J];四川大学学报(工程科学版);2001年02期
9 杨晓飞,陈铁军,尚海涛;基于模式识别的仿人变周期控制器及其应用[J];郑州工业大学学报;2001年04期
10 邹鲁勇;张利建;;基于BP神经网络的仿人智能控制仿真研究[J];自动化与信息工程;2006年04期
11 邓扬玉;王卫星;;智能控制技术在棒材连轧活套控制中的研究与应用[J];可编程控制器与工厂自动化;2008年04期
12 董小闵;李祖枢;余淼;廖昌荣;陈伟民;;仿人智能控制及其在磁流变半主动悬架中的应用(英文)[J];控制理论与应用;2010年02期
13 王应建;王昌银;林建亚;;电液位置伺服系统仿人智能型模糊—自适应控制[J];机械与电子;1990年06期
14 王培进;仿人智能推理与控制器模型的研究[J];计算机应用研究;2001年11期
15 王培进,刘其成;仿人智能控制中的数据挖掘[J];计算机工程与应用;2002年12期
16 王培进,范宝德;仿人智能推理与控制器的实现[J];计算机工程与应用;2002年13期
17 王武,董海鹰;基于组态软件的温度过程仿人智能控制[J];自动化与仪表;2005年06期
18 钱平;王小柘;;基于递推梯度控制的智能二级张力控制系统[J];制造业自动化;2006年02期
19 高富强;裴斌;田小果;;基于仿人智能控制的风机调速算法[J];自动化与仪器仪表;2006年04期
20 刘军;张利建;薛明;;基于遗传算法的仿人智能控制[J];青岛科技大学学报(自然科学版);2007年02期
中国重要会议论文全文数据库 前10条
1 王培进;慕志强;马文明;;仿人智能控制策略的研究[A];第二十六届中国控制会议论文集[C];2007年
2 钟秉翔;刘玉成;李膺;;一种参数在线自校正的仿人智能控制器[A];中国仪器仪表学会测控技术在资源节约和环境保护中的应用学术会议论文集[C];2001年
3 王培进;刘兆伟;王飞;;仿人智能控制论[A];2007年中国智能自动化会议论文集[C];2007年
4 李祖枢;;力矩受限单摆的摆起倒立控制——仿人智能控制在非线性系统中的应用[A];1996年中国智能自动化学术会议论文集(上册)[C];1996年
5 费树岷;刘德荣;;前言[A];2009年中国智能自动化会议论文集(第八分册)[控制理论与应用(专刊)][C];2009年
6 熊建平;杨志;邓仁明;李太福;;基于仿人智能的自适应控制策略[A];中国仪器仪表学会第三届青年学术会议论文集(下)[C];2001年
7 章兢;;仿人智能控制与模糊控制神经网络融合技术[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
8 陈昌忠;陈永会;柏建国;;智能积分器在随动系统中的应用[A];2003年中国智能自动化会议论文集(上册)[C];2003年
9 段其昌;程伟;段盼;;一种基于仿人智能控制的汽油发电机电子调速器[A];2009中国仪器仪表与测控技术大会论文集[C];2009年
10 于洁;孙庚山;;仿人智能控制在型煤压力控制系统中的应用仿真研究[A];1995年中国智能自动化学术会议暨智能自动化专业委员会成立大会论文集(上册)[C];1995年
中国博士学位论文全文数据库 前10条
1 周育才;800MN巨型液压机同步系统精良控制技术研究[D];中南大学;2012年
2 张华;基于动觉智能图式的多级摆系统仿人智能运动控制[D];重庆大学;2006年
3 王牛;基于动觉智能图式足球机器人运动控制[D];重庆大学;2008年
4 董小闵;汽车磁流变半主动悬架仿人智能控制研究[D];重庆大学;2006年
5 时光;智能电—气阀门定位器智能控制策略研究[D];重庆大学;2011年
6 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
7 罗大鹏;基于在线学习理论的目标检测技术[D];华中科技大学;2010年
8 金钊;加速强化学习方法研究[D];云南大学;2010年
9 徐明亮;强化学习及其应用研究[D];江南大学;2010年
10 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 甘晓琴;基于强化学习的仿人智能控制器参数在线学习与优化[D];重庆大学;2010年
2 吴锦;热轧带钢宽度的模糊仿人智能控制策略研究[D];太原理工大学;2011年
3 任冰;模糊仿人智能控制在倒立摆系统中的应用研究[D];兰州理工大学;2010年
4 陈勇军;支持在线学习的测试与资源标注系统的研究与设计[D];华中师范大学;2011年
5 江文;基于消息中间件的在线学习模型研究与应用[D];湖南大学;2005年
6 孔燕;美国K12在线学习发展研究[D];曲阜师范大学;2010年
7 蓝国铧;市民E-Learning在线学习平台[D];华东师范大学;2011年
8 李奉华;基于RIA技术的学习者体验在线学习系统的设计与开发[D];吉林大学;2010年
9 侯海连;基于用户认知的在线学习服务采纳与持续使用的影响因素研究[D];华东理工大学;2011年
10 罗慧娟;数据挖掘在英语在线学习平台中的应用[D];华东师范大学;2011年
中国重要报纸全文数据库 前10条
1 郁芬;江苏省干部在线学习中心网站开通[N];新华日报;2009年
2 通讯员 余燕芳;衢州电大成功开发在线学习平台[N];衢州日报;2011年
3 记者 严晟昱;上海干部在线学习城推进培训个性化[N];组织人事报;2005年
4 记者 肖意 深圳特区报评论员;“深圳干部在线学习”平台开通[N];深圳特区报;2010年
5 万红金;你在线学习了吗[N];人民日报海外版;2000年
6 记者 罗炜;“干部在线学习网”开通[N];黄石日报;2009年
7 刘广平;电力企业在线学习成“时尚”[N];中国电力报;2004年
8 胡厚杰记者 张敬波;宣城干部受益“在线学习”[N];安徽日报;2007年
9 本报记者 郝静;勇于探索天地宽[N];阿勒泰日报;2008年
10 通讯员 王研;云南成立干部在线学习学院[N];中国人事报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978