收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于强化学习的移动机器人自主学习及导航控制

陈春林  
【摘要】:移动机器人是一种能够在工作环境中自主移动并完成预定任务的智能系统,是机器人学和智能控制的一个重要研究领域,在工业、农业、民用以及军事等领域具有广泛的应用前景。在移动机器人的各项研究和应用中,导航是最基本和最重要的问题,移动机器人在其工作环境中必须具有可靠而灵活的自主移动能力,而基于学习的控制方法是实现机器人自主导航的关键技术。 在各种学习方法中,强化学习具有较强的在线自适应性和对复杂系统的自学习能力,且能较好地符合人们解决问题的心理习惯,在机器人导航研究中受到了广泛的关注。然而随着移动机器人应用领域的扩展,对机器人学习与导航控制技术也不断提出了新的挑战,尤其是针对实际工程应用的环境感知、强化学习在连续状态和动作空间的泛化、局部环境的反应式控制、基于混合式控制的大范围空间定性导航等都存在着亟待解决的问题。因此结合人工智能、自动控制、机器人学等领域的研究成果,通过自主学习实现未知环境下的导航控制,是一个关键的研究课题,在移动机器人理论研究和工程应用等方面均具有重要的意义。 本文在分析总结已有工作的基础上,以移动机器人自主学习和导航控制为主要研究内容,深入研究了基于强化学习及其改进方法的移动机器人反应式控制和分层式导航控制,针对不同的导航任务和环境感知信息特点,提出了相应的信息融合方法、知识表示方法、学习算法和控制结构,并从仿真和实际移动机器人硬件平台(ATU—Ⅱ)两个方面对所提出的方法进行了实验验证。主要的研究工作和贡献如下: (1)研究了基于多超声波传感器系统的数据融合及知识表示方法 设计了适用于移动机器人的多超声波传感器系统,并提出了一种基于多超声波传感器的目标识别方法。利用数据融合技术,根据多超声波传感器的TOF(Time-of-Flight)信息,提出了基于目标原型的目标识别和对感兴趣目标的主动探测方法,实现了移动机器人对室内特征环境较为准确的识别,为复杂任务的自动分解提供了一种合适的子目标来源。 基于灰色系统理论,提出了灰色测量系统与灰色传感器的概念,给出了感知信息的灰色表示与运算,并以多超声波传感器系统为例做了相应的说明。对环境状态的灰色表示与处理为导航问题中的混合地图创建、基于灰色控制规则的学习算法等奠定了基础。 (2)研究了基于强化学习的反应式控制方法 给出了一种基于强化学习和模糊逻辑的反应式控制方法,结合模糊逻辑实现了对感知信息的模糊化,有效处理了连续状态和动作空间问题;在实际控制中分别设计了避障和寻找目标点两种反应式行为分别进行学习训练,并根据行为融合输出最终控制命令,完成感知信息到移动机器人动作的映射。同时针对未知环境下机器人导航中存在的感知信息不完备、推理过程具有不确定性的特点,对基于灰色系统理论的知识表示和灰色强化函数进行了初步探


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陆军,徐莉,周小平;强化学习方法在移动机器人导航中的应用[J];哈尔滨工程大学学报;2004年02期
2 郑炳文;;基于改进Q-学习的导航知识获取算法研究[J];科学之友;2011年04期
3 张汝波,顾国昌,刘照德,王醒策;强化学习理论、算法及应用[J];控制理论与应用;2000年05期
4 李宁,高阳,陆鑫,陈世福;一种基于强化学习的学习Agent[J];计算机研究与发展;2001年09期
5 殷翔,黄展翔;强化学习在仿真机器人足球踢球动作中的应用[J];苏州大学学报(工科版);2002年04期
6 李春贵,刘永信;一种有限时段Markov决策过程的强化学习算法[J];广西工学院学报;2003年01期
7 张荣,陈卫东;基于强化学习的倒立摆起摆与平衡全过程控制[J];系统工程与电子技术;2004年01期
8 张化祥;黄上腾;;基于强化学习与对策的多代理协同技术[J];计算机科学;2004年08期
9 刘菲;曾广周;;基于强化学习的多移动Agent学习算法[J];计算机工程与应用;2006年05期
10 宋一然;;基于强化学习的多机器人路径规划方法[J];莆田学院学报;2006年02期
11 王本年;高阳;陈兆乾;谢俊元;陈世福;;RLGA:一种基于强化学习机制的遗传算法[J];电子学报;2006年05期
12 邢高峰;;浅谈智能机器人避碰行为的学习方法[J];电脑知识与技术(学术交流);2007年15期
13 柳毅;高晓光;卢广山;陈红林;;机载多智能体信息融合决策系统[J];火力与指挥控制;2007年09期
14 何锫;王峰;肖淑苹;;基于异联想记忆Hopfield网络的强化学习[J];微计算机信息;2008年26期
15 王云;韩伟;;一种基于划分和集成思想的多智能体强化学习[J];南京师范大学学报(工程技术版);2008年04期
16 韩伟;;效用驱动的Markov强化学习[J];计算机工程与应用;2009年04期
17 徐志洁;;一种处理多类分类问题的强化支持向量机方法[J];计算机工程与应用;2009年26期
18 陈学松;杨宜民;;强化学习研究综述[J];计算机应用研究;2010年08期
19 王立春,高阳,陈世福;AODE中基于强化学习的Agent协商模型[J];南京大学学报(自然科学版);2001年02期
20 郭红霞,吴捷,王春茹;基于强化学习的模型参考自适应控制[J];控制理论与应用;2005年02期
中国重要会议论文全文数据库 前10条
1 卓睿;陈宗海;陈春林;;强化学习在移动机器人导航上的应用[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
2 何宁强;;基于多传感器信息融合的移动机器人导航研究[A];中国计量协会冶金分会2010年会论文集[C];2010年
3 韩盛;李书杰;陈宗海;;移动机器人导航的信息融合技术分析与展望[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
4 文锋;陈宗海;陈春林;;基于RLS-TD和值梯度的强化学习方法用于LQR控制问题[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
5 刘海波;董玉杰;王福忠;牛满仓;;基于单目视觉的移动机器人导航算法研究[A];中国自动化学会控制理论专业委员会D卷[C];2011年
6 张伟;李建更;张家旺;;多智能体强化学习在机器人足球比赛中的应用[A];2005年中国智能自动化会议论文集[C];2005年
7 陈春林;陈宗海;卓睿;;分层式强化学习的定性空间表达[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
8 张家旺;韩光胜;张伟;;基于ASPL模型的多智能体强化学习在RoboCup中的应用[A];2005中国机器人大赛论文集[C];2005年
9 敬斌;田野;;Robocup中的传球策略[A];2005中国机器人大赛论文集[C];2005年
10 涂自然;王维;梁以业;禹建丽;;基于强化学习的自适应变步长机器人路径规划算法[A];2003年中国智能自动化会议论文集(上册)[C];2003年
中国博士学位论文全文数据库 前10条
1 陈春林;基于强化学习的移动机器人自主学习及导航控制[D];中国科学技术大学;2006年
2 金钊;加速强化学习方法研究[D];云南大学;2010年
3 徐明亮;强化学习及其应用研究[D];江南大学;2010年
4 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
5 朱美强;基于谱图理论的强化学习研究[D];中国矿业大学;2012年
6 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
7 李誌;基于视觉听觉语义相干性的强化学习系统的研究[D];太原理工大学;2012年
8 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
9 刘娟;基于时空信息与认知模型的移动机器人导航机制研究[D];中南大学;2003年
10 陈凤东;基于认知地图的移动机器人自主导航技术研究[D];哈尔滨工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
2 贺振东;基于改进Q-学习的导航知识获取算法研究[D];东北电力大学;2006年
3 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
4 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
5 郭一明;基于强化学习的劣化系统维修策略研究[D];合肥工业大学;2011年
6 任建功;基于强化学习的自主式移动机器人导航控制[D];哈尔滨工业大学;2010年
7 钱征;基于强化学习的倒立摆控制研究[D];北京工业大学;2005年
8 王瑞霞;基于强化学习的倒立摆控制[D];北京工业大学;2005年
9 顾鑫;个性化智能信息检索系统研究[D];哈尔滨工程大学;2004年
10 张驰;基于ROBOCUP的多智能体系统设计与实现[D];北京工业大学;2004年
中国重要报纸全文数据库 前10条
1 孙佳宇;强化学习教育 增强服务意识[N];人民公安报;2009年
2 首席记者 朱丽华;强化学习 落实责任 确保取得实效[N];盘锦日报;2009年
3 王良豪 记者 刘伟 龙先华;通过创新工作取得活动效果[N];六盘水日报;2008年
4 书分;解放区审计局强化学习抓作风[N];焦作日报;2006年
5 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
6 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
7 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
8 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
9 李北川;强化学习 找准问题 着力整改[N];凉山日报(汉);2007年
10 记者 刘莉 实习记者 刘慕欣;兵团党委“保先”教育活动督导组强化学习[N];兵团日报(汉);2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978