收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

多机器人协作的学习与进化方法

杨东勇  
【摘要】:近年来,多机器人系统是机器人学研究中最令人感兴趣且富有挑战性的研究领域。多机器人的研究内容和应用范围十分广泛,如多机器人协作搬运,多机器人协作探索和地图构建,以及机器人足球赛等。多机器人系统能够完成单个机器人难以完成的工作任务。一队机器人通过协作可以用更可靠、更快速、更廉价的方法完成给定的任务。因此,关于多机器人协作的研究越来越受到研究者的重视。为了使机器人系统具有适应未知环境的能力,让机器人在与环境和其它机器人的相互作用中,学习和进化协作行为,是多机器人协作研究中最有潜力的方法之一。 本论文以多机器人协作搬运为研究背景,主要研究基于强化学习和合作协进化的多个机器人协作行为的获得方法。论文的主要研究成果如下: (1) 综述了多机器人协作的研究现状;全面地分析讨论了多机器人系统的分类、多机器人协作的主要研究内容、多机器人协作的主要研究方法和所取得的研究进展;系统地总结了进化和协进化方法研究机器人个体和群体行为的主要研究方式、研究结果和存在的主要问题;讨论了强化学习方法在多机器人行为学习中的应用及面临的困难。 (2) 设计开发了一个多机器人协作搬运多个物体的仿真环境,为基于学习和进化方法研究多机器人协作行为提供了一个良好的试验平台。 (3) 提出了一种获得多机器人协作行为的分布式两层强化学习方法,并以三个机器人通过强化学习,协作抬起一个园盘形物体的行为学习过程的仿真,验证了所提出的方法的有效性。 (4) 构建了一种基于状态预测的强化学习方法,讨论了算法的模型和实现方法;把所设计的算法应用于三个机器人通过学习,协作抬起一个物体的协作任务,给出了仿真结果。 (5) 以多个机器人合作完成多个物体的搬运为应用对象,提出了一种形成多机器人协作行为的多种群合作协进化方法。该方法由搬运任务的平衡分配和搬运序列的多种群合作协进化两个过程组成。实验结果表明所提出的方法具有更好的性能。 (6) 提出了一种机器人局部导航的改进势能场方法。通过采用圆形活动窗口、考虑机器人身体大小的斥力场设计方法和自适应的目标引力场设计方法,以及强化掌舵控制


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 殷翔,黄展翔;强化学习在仿真机器人足球踢球动作中的应用[J];苏州大学学报(工科版);2002年04期
2 李春贵,刘永信;一种有限时段Markov决策过程的强化学习算法[J];广西工学院学报;2003年01期
3 刘菲;曾广周;;基于强化学习的多移动Agent学习算法[J];计算机工程与应用;2006年05期
4 宋一然;;基于强化学习的多机器人路径规划方法[J];莆田学院学报;2006年02期
5 何锫;王峰;肖淑苹;;基于异联想记忆Hopfield网络的强化学习[J];微计算机信息;2008年26期
6 张汝波,顾国昌,刘照德,王醒策;强化学习理论、算法及应用[J];控制理论与应用;2000年05期
7 李宁,高阳,陆鑫,陈世福;一种基于强化学习的学习Agent[J];计算机研究与发展;2001年09期
8 张荣,陈卫东;基于强化学习的倒立摆起摆与平衡全过程控制[J];系统工程与电子技术;2004年01期
9 张化祥;黄上腾;;基于强化学习与对策的多代理协同技术[J];计算机科学;2004年08期
10 王本年;高阳;陈兆乾;谢俊元;陈世福;;RLGA:一种基于强化学习机制的遗传算法[J];电子学报;2006年05期
11 邢高峰;;浅谈智能机器人避碰行为的学习方法[J];电脑知识与技术(学术交流);2007年15期
12 柳毅;高晓光;卢广山;陈红林;;机载多智能体信息融合决策系统[J];火力与指挥控制;2007年09期
13 王云;韩伟;;一种基于划分和集成思想的多智能体强化学习[J];南京师范大学学报(工程技术版);2008年04期
14 韩伟;;效用驱动的Markov强化学习[J];计算机工程与应用;2009年04期
15 徐志洁;;一种处理多类分类问题的强化支持向量机方法[J];计算机工程与应用;2009年26期
16 陈学松;杨宜民;;强化学习研究综述[J];计算机应用研究;2010年08期
17 王立春,高阳,陈世福;AODE中基于强化学习的Agent协商模型[J];南京大学学报(自然科学版);2001年02期
18 郭红霞,吴捷,王春茹;基于强化学习的模型参考自适应控制[J];控制理论与应用;2005年02期
19 李春贵;多步截断优先扫描强化学习算法[J];计算机工程;2005年11期
20 钱旭培;;一种基于DFS的Agent在线学习模型研究[J];计算机与现代化;2006年11期
中国重要会议论文全文数据库 前10条
1 李磊民;刘刚;;基于MAS和传感器信息的多机器人协作研究[A];第二十七届中国控制会议论文集[C];2008年
2 文锋;陈宗海;陈春林;;基于RLS-TD和值梯度的强化学习方法用于LQR控制问题[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
3 卓睿;陈宗海;陈春林;;强化学习在移动机器人导航上的应用[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
4 张伟;李建更;张家旺;;多智能体强化学习在机器人足球比赛中的应用[A];2005年中国智能自动化会议论文集[C];2005年
5 陈春林;陈宗海;卓睿;;分层式强化学习的定性空间表达[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
6 张家旺;韩光胜;张伟;;基于ASPL模型的多智能体强化学习在RoboCup中的应用[A];2005中国机器人大赛论文集[C];2005年
7 敬斌;田野;;Robocup中的传球策略[A];2005中国机器人大赛论文集[C];2005年
8 涂自然;王维;梁以业;禹建丽;;基于强化学习的自适应变步长机器人路径规划算法[A];2003年中国智能自动化会议论文集(上册)[C];2003年
9 孙凤池;殷爱茹;;一种基于SCADA的远程监控多机器人协作系统设计[A];2001年中国智能自动化会议论文集(上册)[C];2001年
10 方宝富;王浩;姚宏亮;杨静;周晋;;Q学习在机器人足球中的应用[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 杨东勇;多机器人协作的学习与进化方法[D];浙江大学;2005年
2 蔡云飞;多机器人协作定位及系统架构研究[D];南京理工大学;2011年
3 范波;基于Agent的多机器人信息融合与协调研究[D];西北工业大学;2004年
4 金钊;加速强化学习方法研究[D];云南大学;2010年
5 徐明亮;强化学习及其应用研究[D];江南大学;2010年
6 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
7 张子迎;多机器人协作及环境建模技术研究[D];哈尔滨工程大学;2009年
8 朱美强;基于谱图理论的强化学习研究[D];中国矿业大学;2012年
9 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
10 秦元庆;多移动机器人系统运动控制研究[D];华中科技大学;2007年
中国硕士学位论文全文数据库 前10条
1 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
2 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
3 陈雪江;基于强化学习的多机器人协作机制研究[D];浙江工业大学;2004年
4 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
5 郭一明;基于强化学习的劣化系统维修策略研究[D];合肥工业大学;2011年
6 朱宁宁;基于强化学习的多机器人协作研究[D];兰州理工大学;2012年
7 钱征;基于强化学习的倒立摆控制研究[D];北京工业大学;2005年
8 王瑞霞;基于强化学习的倒立摆控制[D];北京工业大学;2005年
9 姜新丽;基于强化学习的多机器人协作控制方法研究[D];沈阳理工大学;2010年
10 顾鑫;个性化智能信息检索系统研究[D];哈尔滨工程大学;2004年
中国重要报纸全文数据库 前10条
1 孙佳宇;强化学习教育 增强服务意识[N];人民公安报;2009年
2 首席记者 朱丽华;强化学习 落实责任 确保取得实效[N];盘锦日报;2009年
3 王良豪 记者 刘伟 龙先华;通过创新工作取得活动效果[N];六盘水日报;2008年
4 书分;解放区审计局强化学习抓作风[N];焦作日报;2006年
5 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
6 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
7 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
8 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
9 李北川;强化学习 找准问题 着力整改[N];凉山日报(汉);2007年
10 记者 刘莉 实习记者 刘慕欣;兵团党委“保先”教育活动督导组强化学习[N];兵团日报(汉);2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978