收藏本站
《北京工业大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于强化学习的倒立摆控制研究

钱征  
【摘要】:倒立摆问题是复杂系统控制中一个经典问题,倒立摆系统是一种非线性、多变量和绝对不稳定的系统。在控制过程中,它能有效地反映诸如可镇定性、鲁棒性、随动性以及跟踪等许多控制中的关键问题,是检验各种控制理论的理想模型。在近代的机械系统控制中,如火箭的发射、人造卫星的运行、机器人的举重及机器人的行走,都存在类似于倒立摆系统稳定控制的相似问题。因此倒立摆的研究不仅有其深刻的理论意义,还有重要的工程意义。 强化学习是近年来机器学习和人工智能领域研究的热点之一,并且引起了运筹学、控制理论、机器人学等其他学科研究人员的普遍注意,成为一个多学科交叉的研究方向。强化学习不需要教师信号,它强调在与环境的交互中学习,以极大(或极小)化从环境获得的评价性反馈信号为学习目标。 本课题以研究运动平衡控制技能的认知为出发点,以强化学习为研究对象,以倒立摆系统为实验模型,通过智能体对倒立摆的平衡控制研究,使智能系统具有学习能力,能在系统运行过程中逐步获取新信息,具有类似人类和动物的运动控制技能。本课题在强化学习和动态规划算法的基础上,提出了一种基于双BP网络的强化学习系统。该强化学习系统在没有先验知识的条件下,智能体通过自身神经网络的在线学习,认知倒立摆系统的平衡控制技能,最终能有效地控制不稳定的倒立摆系统。通过不同条件的实验仿真,证明了提出的强化学习系统在学习过程中有认知倒立摆系统的平衡控制技能的能力。
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP18

【相似文献】
中国期刊全文数据库 前10条
1 张玉梅;阮晓钢;;基于一种生长型神经网络的倒立摆控制[J];计算机仿真;2006年05期
2 郑宇;罗四维;吕子昂;;基于定性模糊网络的分层Option算法[J];信息与控制;2009年06期
3 陈圣磊;李卫红;姚娟;;基于最小二乘的Q(λ)强化学习算法[J];计算机工程与应用;2008年34期
4 李明爱;焦利芳;郝冬梅;乔俊飞;;基于多个并行CMAC神经网络的强化学习方法[J];系统仿真学报;2008年24期
5 张荣,陈卫东;基于强化学习的倒立摆起摆与平衡全过程控制[J];系统工程与电子技术;2004年01期
6 王瑞霞;孙亮;阮晓钢;;基于强化学习的二级倒立摆控制[J];计算机仿真;2006年04期
7 张涛;吴汉生;;基于神经网络的强化学习算法实现倒立摆控制[J];计算机仿真;2006年04期
8 黄晗文;郑宇;;强化学习中基于定性模型的知识传递方法[J];计算机工程与科学;2011年06期
9 蒋国飞,吴沧浦;基于Q学习算法和BP神经网络的倒立摆控制[J];自动化学报;1998年05期
10 齐国元,陈增强,袁著祉;倒立摆系统自适应高阶微分反馈控制(英文)[J];控制理论与应用;2004年05期
中国重要会议论文全文数据库 前10条
1 杨亚炜;张明廉;;倒立摆系统的运动模态分析[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
2 文锋;陈宗海;陈春林;;基于RLS-TD和值梯度的强化学习方法用于LQR控制问题[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
3 卓睿;陈宗海;陈春林;;强化学习在移动机器人导航上的应用[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
4 李凌;苗鑫;袁德成;;基于神经网络控制的倒立摆系统仿真研究[A];第九届全国信息获取与处理学术会议论文集Ⅰ[C];2011年
5 张伟;李建更;张家旺;;多智能体强化学习在机器人足球比赛中的应用[A];2005年中国智能自动化会议论文集[C];2005年
6 袁韬;陈皓;兰杰;;倒立摆自抗扰控制算法简易实现[A];2010年西南三省一市自动化与仪器仪表学术年会论文集[C];2010年
7 张家旺;韩光胜;张伟;;基于ASPL模型的多智能体强化学习在RoboCup中的应用[A];2005中国机器人大赛论文集[C];2005年
8 敬斌;田野;;Robocup中的传球策略[A];2005中国机器人大赛论文集[C];2005年
9 陈春林;陈宗海;卓睿;;分层式强化学习的定性空间表达[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
10 涂自然;王维;梁以业;禹建丽;;基于强化学习的自适应变步长机器人路径规划算法[A];2003年中国智能自动化会议论文集(上册)[C];2003年
中国重要报纸全文数据库 前10条
1 孙佳宇;强化学习教育 增强服务意识[N];人民公安报;2009年
2 首席记者 朱丽华;强化学习 落实责任 确保取得实效[N];盘锦日报;2009年
3 王良豪 记者 刘伟 龙先华;通过创新工作取得活动效果[N];六盘水日报;2008年
4 书分;解放区审计局强化学习抓作风[N];焦作日报;2006年
5 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
6 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
7 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
8 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
9 李北川;强化学习 找准问题 着力整改[N];凉山日报(汉);2007年
10 记者 刘莉 实习记者 刘慕欣;兵团党委“保先”教育活动督导组强化学习[N];兵团日报(汉);2005年
中国博士学位论文全文数据库 前10条
1 金钊;加速强化学习方法研究[D];云南大学;2010年
2 徐明亮;强化学习及其应用研究[D];江南大学;2010年
3 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
4 朱美强;基于谱图理论的强化学习研究[D];中国矿业大学;2012年
5 郑宇;分层强化学习算法及其应用研究[D];北京交通大学;2009年
6 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
7 李誌;基于视觉听觉语义相干性的强化学习系统的研究[D];太原理工大学;2012年
8 张克勤;滑模变结构控制理论及其在倒立摆系统中的应用研究[D];浙江大学;2003年
9 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
10 王玉坤;自适应逆控制及其应用的研究[D];哈尔滨工程大学;2006年
中国硕士学位论文全文数据库 前10条
1 钱征;基于强化学习的倒立摆控制研究[D];北京工业大学;2005年
2 王瑞霞;基于强化学习的倒立摆控制[D];北京工业大学;2005年
3 狄艳坤;神经网络技术在倒立摆系统中的应用研究[D];哈尔滨理工大学;2010年
4 焦灵侠;模糊控制在倒立摆系统中的应用研究[D];西安工业大学;2010年
5 王玉琢;基于模糊神经网络的倒立摆系统控制研究[D];哈尔滨理工大学;2010年
6 汪涛;模糊神经网络控制在单级倒立摆系统中的应用[D];合肥工业大学;2004年
7 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
8 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
9 赵梦欣;倒立摆的非线性动力学与控制的研究[D];北京工业大学;2003年
10 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026