收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于强化学习的移动机器人路径规划研究

高慧  
【摘要】:随着移动机器人技术的飞速发展,应用于未知环境下的移动机器人路径规划技术得到了越来越多专家的关注与研究。强化学习是一种重要的机器学习方法,通过不断试错与环境交互寻找最优策略。针对未知环境下的移动机器人路径规划问题,研究基于强化学习的移动机器人路径规划。首先,针对强化学习机器人面临的探索与利用间的权衡问题,设计一种基于近似动作空间模型策略选择的Q-学习算法。该方法根据机器人运动过程中周围的环境信息,降低机器人真实动作空间模型的复杂程度,提高计算效率。与传统的动作选择策略相比,基于近似动作模型的策略选择方法能够得到一条更加优化的路径,且提高了机器人路径规划的成功率。然后,针对复杂动态环境下的机器人路径规划问题,采用分层强化学习的方法,将路径规划系统从上至下分为根任务协作层、子任务选择层和环境交互层三层结构,并将路径规划任务划分为静态障碍物避障、动态障碍物避障及趋向目标点运动三个基本子任务,减小状态空间以及系统学习的难度。最后,搭建移动机器人系统的软硬件平台,在Ubuntu操作系统和ROS(Robot Operating System,机器人操作系统)软件框架下,实现数据通信,并设计Pioneer3-AT移动机器人的三维仿真模型和三维仿真环境,实现基于强化学习的移动机器人路径规划的三维仿真实验,然后结合Pioneer3-AT移动机器人进行实物实验。实验结果证明移动机器人在未知环境下通过自主学习能够自主运动到达目标点。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李波,陈慧宝,徐解民,程桂森;侦察排爆移动机器人的现状及关键技术[J];机电一体化;2004年04期
2 付宜利,李寒,徐贺,马玉林;轮式全方位移动机器人几种转向方式的研究[J];制造业自动化;2005年10期
3 王仲民,岳宏,刘继岩;移动机器人多传感器信息融合技术述评[J];传感器技术;2005年04期
4 章小兵,宋爱国;地面移动机器人研究现状及发展趋势[J];机器人技术与应用;2005年02期
5 李焕全;;基于“势点”的多移动机器人协调围捕/拦截策略[J];自动化与仪表;2007年05期
6 郭小勤;徐刚;;具有超前特性的移动机器人跟踪截获控制算法[J];制造业自动化;2007年09期
7 顾新艳;;基于多传感器信息融合的移动机器人定位技术研究[J];科技信息;2008年34期
8 吴玉香;王萍;;移动机器人虚拟仿真平台设计与实现[J];计算机测量与控制;2008年02期
9 王军德;肖刚;;曲面上两轮移动机器人的建模与分析[J];机床与液压;2008年05期
10 田学军;;非差分GPS在移动机器人位点导航中的应用[J];制造业自动化;2009年06期
11 王雷;;移动机器人高精度坐标校正的方法[J];硅谷;2010年14期
12 王鸿鹏;杨云;刘景泰;;高速移动机器人的研究现状与发展趋势[J];自动化与仪表;2011年12期
13 曹凯;;移动机器人技术研究现状与未来[J];信息系统工程;2013年05期
14 孙鹤旭;邵岩;邢关生;刘宁;田双娜;;移动机器人网络的嵌入式Web系统设计[J];计算机工程;2013年09期
15 刘传才,杨静宇,江志明;四轮移动机器人的前后轮双里程仪系统的误差分析[J];机器人;1998年02期
16 ;温室内移动机器人[J];机器人技术与应用;1998年04期
17 胡终须,胡跃明,毛宗源;基于非完整移动机器人动态模型的鲁棒输出跟踪[J];控制与决策;2000年05期
18 章亚男,周建梁;微小移动机器人研究现状及关键技术[J];机电一体化;2000年04期
19 杨波,张振龙;多肢体自位移动机器人的研究[J];机电一体化;2000年05期
20 顾冬雷,陈卫东,席裕庚;移动机器人条件反射能力的实现[J];机器人;2001年02期
中国重要会议论文全文数据库 前10条
1 汤亚锋;姚红;杨庆;;气浮式移动机器人的模糊运动控制方法[A];2009年中国智能自动化会议论文集(第一分册)[C];2009年
2 李斌;刘景泰;孙雷;王鸿鹏;李宝炯;;面向复杂环境作业的轮式滑动转向移动机器人平台设计[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
3 李书杰;韩盛;陈宗海;;基于环境剖分的移动机器人层次地图[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
4 李伟;江晓佳;王彦昕;王永强;;基于模糊逻辑推理的室外移动机器人道路边沿抽取的方法[A];1995年中国智能自动化学术会议暨智能自动化专业委员会成立大会论文集(上册)[C];1995年
5 李贻斌;李彩虹;刘明;周凤余;宋锐;;不确定环境下移动机器人的运动控制[A];第十九届中国控制会议论文集(二)[C];2000年
6 王朝立;简献忠;丁云飞;;实际输入受限下一类非完整平面移动机器人的镇定[A];第二十三届中国控制会议论文集(下册)[C];2004年
7 任小芳;黄玉美;;移动机器人的双目立体视觉导航[A];制造技术自动化学术会议论文集[C];2004年
8 陈勇;戴先中;孟正大;;多移动机器人可重构物流系统建模方法[A];2005全国自动化新技术学术交流会论文集(三)[C];2005年
9 杨毅;付梦印;孙常胜;王美玲;赵诚;;移动机器人航迹跟踪控制律设计与仿真平台开发[A];第二十六届中国控制会议论文集[C];2007年
10 任燚;陈宗海;周光明;;基于行为的移动机器人噪声影响研究[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 高健;小型履带式移动机器人遥自主导航控制技术研究[D];北京理工大学;2015年
2 宗成国;履带可变角度的关节式移动机器人技术研究[D];北京理工大学;2015年
3 刘飞;室外环境移动机器人效能最优化研究[D];重庆大学;2015年
4 独孤明哲(Myongchol Tokgo);基于QPSO算法的移动机器人轨迹规划研究[D];华中科技大学;2015年
5 刘大亮;一种球形移动机器人的运动分析与控制技术的研究[D];北京邮电大学;2009年
6 齐海铭;管内移动机器人示踪定位技术研究[D];哈尔滨工业大学;2010年
7 徐贺;可重构多机动模式移动机器人及其关键技术研究[D];哈尔滨工业大学;2006年
8 王海英;智能优化算法研究及其在移动机器人相关技术中的应用[D];哈尔滨理工大学;2007年
9 欧屹;特种地面移动机器人机械系统设计与分析[D];南京理工大学;2013年
10 李枚毅;基于免疫机制和多示例学习的移动机器人进化导航研究[D];中南大学;2005年
中国硕士学位论文全文数据库 前10条
1 韩滔;移动机器人状态估计算法鲁棒性改进方法研究[D];浙江大学;2015年
2 孙丽萍;变电站带电水冲洗移动机器人控制系统研究[D];山东建筑大学;2015年
3 李强;非结构环境下移动机器人即时定位与地图创建算法研究[D];天津理工大学;2015年
4 王佳佳;轮式移动机器人系统实现与编队控制[D];西南交通大学;2015年
5 刘博;基于激光雷达的室内外巡检移动机器人原型设计与实现[D];西南交通大学;2015年
6 姜腾光;移动机器人视觉导航及控制方法研究[D];沈阳理工大学;2015年
7 潘洲;基于混合算法的移动机器人动态路径规划研究[D];上海应用技术学院;2015年
8 田浩;面向移动机器人的低频无线充电技术研究[D];哈尔滨工业大学;2015年
9 刘芳;动态未知环境下移动机器人同时定位与地图创建[D];哈尔滨工业大学;2015年
10 汪贵冬;移动机器人在未知环境下的实时定位与建图研究[D];安徽工程大学;2015年
中国重要报纸全文数据库 前1条
1 本报记者 刘一博 张雯婧;“蓝领之王”是怎样炼成的[N];天津日报;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978