收藏本站
《中国海洋大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

多移动机器人运动控制策略的强化学习研究

庄晓东  
【摘要】:多移动机器人是机器人研究的主要内容之一,路径规划、运动控制是移动机器人完成各种任务的关键。采用机器学习特别是强化学习方法实现多机器人环境中路径规划和运动控制,是近年来机器人研究的热点。本论文研究了多机器人环境中运动控制策略的强化学习,本文的研究工作主要从四个方面展开:动态环境中的建模规划、多障碍环境中的运动控制策略学习和优化、强化学习方法的改进研究、基于多机器人仿真实验平台的策略强化学习研究。 在动态环境中的机器人控制研究中,提出了一种基于模糊概念和可能性理论的环境建模方法,在此基础上进行模糊决策,有效的实现动态运动控制,获得高效的实时、避障规划效果。 在多障碍环境中的移动机器人路径规划方面,提出了人工势场法和蚁群优化算法相结合的路径规划方法,将人工势场作为先验知识,对蚁群优化算法进行初始化,和已有的蚁群路径规划算法相比,显著提高了规划速度。 在对强化学习方法的改进方面,针对传统算法在大状态空间中学习效率低的问题,提出针对模糊状态的强化学习算法(FSRL),并基于模糊状态实现离散状态空间中的多尺度学习;考察蚁群优化算法的状态相关性特点,在时间学习尺度上对传统算法进行改进,提出蚁群强化学习算法(RAL)和延迟优化学习算法(DORL);并应用于多障碍环境路径规划,和基于传统强化学习的路径规划方法相比,显著提高了规划性能。 根据实际应用时环境状态的不确定性、学习过程中策略的不确定性,在随机变量熵的概念下,提出强化学习中的决策熵,来定量度量学习过程中策略的不确定性(即策略收敛程度);提出强化学习中的状态熵,来描述观测状态信息不完整引起的不确定性;基于决策熵,提出具有自适应学习率的学习算法,通过多障碍环境路径规划仿真实验,表明自适应学习率有效的提高了学习性能。 基于TeamBots多机器人仿真实验平台,进行了多机器人目标搜索和机器人足球的策略学习实验,应用改进的自适应学习率方法成功实现多移动机器人环境中的控制策略学习,并且足球机器人仿真实验中,通过强化学习实现了机器人之间的协作分工。
【学位授予单位】:中国海洋大学
【学位级别】:博士
【学位授予年份】:2005
【分类号】:TP242

【相似文献】
中国期刊全文数据库 前10条
1 任伟建;刘世聪;孙超;;基于混沌遗传算法的机器人路径规划方法研究[J];微型机与应用;2011年13期
2 陈煜敏;;移动机器人在障碍空间中路径规划的研究[J];科技信息;2011年15期
3 蒋明;王姮;张华;解兴哲;;改进遗传算法在移动机器人全局路径规划中的应用[J];计算机应用与软件;2011年08期
4 李光;彭礼辉;;基于节点扩张的遗传算法在机器人路径规划中的应用[J];计算技术与自动化;2011年02期
5 邵杰;杨静宇;石朝侠;;基于学习分类器的自主地面车在狭隘环境中的路径规划[J];信息与控制;2011年03期
6 吴翔;马孜;胡英;李爱国;;焊接机器人快速修复与成型辅助软件设计[J];大连海事大学学报;2011年03期
7 陈伟;赵德安;平向意;;基于蚁群算法的喷涂机器人喷枪路径规划[J];机械设计与制造;2011年07期
8 黄军伟;何元飞;张艳晓;董金明;;蚁群算法在路径规划中的应用研究[J];中国科技信息;2011年15期
9 牛治永;李炎;李晓岚;;基于改进蚁群算法的机器人路径规划[J];自动化技术与应用;2011年07期
10 李巍;王改云;;改进微粒群算法在机器人路径规划中的应用[J];计算机仿真;2011年08期
中国重要会议论文全文数据库 前10条
1 沈捷;费树岷;刘怀;;多移动机器人编队运动的路径规划[A];2003中国控制与决策学术年会论文集[C];2003年
2 马玉林;闫庆辉;付宜利;;复杂障碍环境下轮式移动操作机路径规划算法[A];人才、创新与老工业基地的振兴——2004年中国机械工程学会年会论文集[C];2004年
3 王学先;霍伟;;移动机器人路径跟踪的临时路径方法[A];2002中国控制与决策学术年会论文集[C];2002年
4 朱磊;费敏锐;李佳骏;;Fira仿真足球机器人运动路径规划方法研究[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
5 杨泽青;刘丽冰;谭志洪;刘伟玲;;自适应遗传算法在柔性检测路径规划中的应用[A];第二十七届中国控制会议论文集[C];2008年
6 周惠友;郭海英;钟廷修;;液压集成块的虚拟设计[A];第一届全国流体动力及控制工程学术会议论文集[C];2000年
7 段莉琼;崔铁军;雷大伟;;汽车自导航系统中加入道路转向限制的最短路径算法[A];全国测绘与地理信息技术研讨交流会专辑[C];2003年
8 施麟书;楼东武;;足球机器人智能控制决策系统的优化[A];2004全国测控、计量与仪器仪表学术年会论文集(下册)[C];2004年
9 刘杰;闫清东;;基于蚁群算法的移动机器人路径规划技术的研究[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
10 黄鹏;杨鹏;黄军雷;刘作军;;几种运动规划策略在机器人足球中的应用[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
中国重要报纸全文数据库 前10条
1 本报实习记者  张研;卫星导航 玩转“五一”[N];计算机世界;2006年
2 成都 苏坛;车载GPS实用选购技巧[N];电子报;2008年
3 四川 苏杭;轻松用好车载GPS小技巧[N];电子报;2008年
4 曹乙帆;6大GPS采购建议 寻觅最佳行车导航方案[N];电子资讯时报;2007年
5 浙江大学 潘志庚李永青;在虚拟世界中体验奥运[N];计算机世界;2007年
6 张晔;首个智能交通项目建成[N];科技日报;2007年
7 李军;中寰导航快易行昨天亮相[N];人民邮电;2004年
8 中国科学院计算技术研究所 申排伟 张林广 张进 方金云;空间计算技术服务智通交通[N];计算机世界;2005年
9 小宗;中寰导航快易行前景看好[N];人民邮电;2004年
10 ;征途“双响炮”[N];电脑报;2007年
中国博士学位论文全文数据库 前10条
1 庄晓东;多移动机器人运动控制策略的强化学习研究[D];中国海洋大学;2005年
2 辛江慧;探测车自适应障碍识别与路径规划研究[D];南京航空航天大学;2009年
3 周芳;蒸汽发生器检修机械手路径规划及控制方法研究[D];哈尔滨工程大学;2010年
4 杨帆;多移动机器人编队控制与协作运输研究[D];华东理工大学;2011年
5 曹江丽;水下机器人路径规划问题的关键技术研究[D];哈尔滨工程大学;2009年
6 秦元庆;多移动机器人系统运动控制研究[D];华中科技大学;2007年
7 刘丽珏;免疫进化算法及其在多机器人协作中的应用研究[D];中南大学;2008年
8 武心安;未知环境下自主式水下潜器路径规划问题研究[D];哈尔滨工程大学;2010年
9 李雄;飞行危险天气下的航班改航路径规划研究[D];南京航空航天大学;2009年
10 范红;智能机器人路径规划及避障的研究[D];浙江大学;2003年
中国硕士学位论文全文数据库 前10条
1 刘金芳;分布式实时仿真实验系统开发与多移动机器人规划算法研究[D];吉林大学;2005年
2 李魁星;基于信息熵遗传算法的舰船导航路径规划技术研究[D];哈尔滨工程大学;2010年
3 隋玲玲;复杂未知环境下机器人路径规划算法研究[D];复旦大学;2010年
4 王迎春;一种球形月球探测机器人的机构设计与路径规划研究[D];北京邮电大学;2010年
5 谷燕子;移动机器人路径规划技术研究[D];河南科技大学;2011年
6 余光伟;自主移动机器人路径规划方法研究[D];长春工业大学;2010年
7 李科迪;智能汽车宏观路径规划方法研究[D];吉林大学;2011年
8 王鹏;航空旅行路径规划问询系统的研究与实现[D];沈阳工业大学;2003年
9 彭展;基于快速扩展随机树的机器人路径规划算法仿真实验平台研究[D];中南大学;2004年
10 周翔;大尺度环境下的AUV路径规划与路径跟踪[D];中国海洋大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026