收藏本站
《沈阳理工大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于强化学习的多机器人协作控制方法研究

姜新丽  
【摘要】: 多机器人协作是研究机器人领域的一项重要课题。由于多机器人协作可以完成单机器人无法完成的工作,因此越来越多的学者专注于多机器人系统的研究。目前对于多机器人系统而言,外部环境复杂多变且其可能面临多种选择,若只提供相对的控制参数,多机器人之间将难以形成有效的协作,难免产生资源浪费和冲突。为促进机器人有效协作和系统优化,研究学者更加注重了机器人自身的学习能力。 强化学习算法是近几年发展起来的一种重要的机器学习方法,它是机器人通过感知环境信息来学习系统的最优策略。机器人通过不断的试错和与环境的交互来改善自身行为,从而具有了自主学习的能力,可以有效地完成协作。为此本文对基于强化学习的多机器人协作控制方法进行了深入研究,所做了工作如下: (1)系统分析了多机器人系统的概念和组织行为,采用强化学习理论和方法,研究机器人的路径规划问题。通过试错--评价的在线学习,使机器人选择优化的路径从起点运动到目标点,得到所需的机器人运动行为的规划规则,为进一步研究多机器人系统协作行为的控制方法奠定理论基础。 (2)提出多机器人协作围捕的混合强化学习方法。将强化学习系统拆分为两个学习子系统--目标追踪子系统与目标围捕子系统,以解决复杂协作围捕问题,利用模糊逻辑来解决多机器人系统状态空间大的问题,同时引入启发式奖惩函数设计的思想,以提高机器人搜索目标的效率,采用黑板通信与基于协商和意愿强化的协调方法,解决机器人之间的行为冲突,通过面向对象编程技术的仿真试验验证了上述方法的有效性。
【学位授予单位】:沈阳理工大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP242

【引证文献】
中国硕士学位论文全文数据库 前3条
1 陈腾峰;基于机器学习的多机器人避碰研究[D];沈阳工业大学;2012年
2 刘飞;强化学习在足球机器人仿真中的应用[D];长沙理工大学;2012年
3 朱宁宁;基于强化学习的多机器人协作研究[D];兰州理工大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 周浦城;洪炳镕;黄庆成;;一种新颖的多agent强化学习方法[J];电子学报;2006年08期
2 宋梅萍,顾国昌,张汝波;移动机器人的自适应式行为融合方法[J];哈尔滨工程大学学报;2005年05期
3 洪炳镕;朴松昊;;基于冲突消解的群体智能机器人协作研究[J];哈尔滨工业大学学报;2003年09期
4 王醒策,张汝波,顾国昌;多机器人动态编队的强化学习算法研究[J];计算机研究与发展;2003年10期
5 顾冬雷,陈卫东,席裕庚;机器人足球赛中基于增强学习的任务分工[J];机器人;2000年06期
6 谭民,范永,徐国华;机器人群体协作与控制的研究[J];机器人;2001年02期
7 顾国昌,仲宇,张汝波;一种新的多智能体强化学习算法及其在多机器人协作任务中的应用[J];机器人;2003年04期
8 王越超,谈大龙;协作机器人学的研究现状与发展[J];机器人;1998年01期
9 张文志,李智军,吕恬生,罗青;自适应模糊RBF神经网络的多智能体机器人强化学习[J];计算机工程与应用;2003年32期
10 周浦城,洪炳镕,郭耸;基于强化学习的多机器人协作[J];计算机工程与应用;2005年28期
中国博士学位论文全文数据库 前1条
1 黄炳强;强化学习方法及其应用研究[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前9条
1 陈雪江;基于强化学习的多机器人协作机制研究[D];浙江工业大学;2004年
2 邓欣;多机器人控制体系结构研究与实现[D];南京理工大学;2004年
3 高建清;基于模糊Q学习的Agent智能决策研究与实现[D];合肥工业大学;2006年
4 高旸;拟人多智体系统体系结构和协调策略的研究[D];北京邮电大学;2006年
5 李力坤;多机器人协作算法及仿真研究[D];哈尔滨工业大学;2006年
6 魏治华;基于强化学习的移动机器人导航及环境状态探测的研究[D];南京理工大学;2006年
7 李钦鹏;基于行为和学习机制的多机器人协作策略研究[D];南京理工大学;2008年
8 田献军;多机器人体系结构与轨迹跟踪的研究[D];武汉理工大学;2009年
9 周文云;强化学习维数灾问题解决方法研究[D];苏州大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 刘国璧;袁宏俊;孙群;孟涛;;基于模糊神经网络的刘翔110m栏成绩预测[J];安徽电子信息职业技术学院学报;2011年01期
2 丁晓贵;神经网络在非线性系统参数辨识中应用[J];安徽工程科技学院学报(自然科学版);2003年04期
3 谢振华;倪成敏;;基于层次分析和模糊数学的电解铝生产安全评价[J];安全;2008年01期
4 张峰;王金超;陈雪波;;机器人队形控制中的二叉树方法[J];辽宁科技大学学报;2010年05期
5 张冬梅;刘强;;一种基于强化学习的传感器网络应用重构决策方法[J];北京交通大学学报;2010年03期
6 唐富杰;刘如平;杨虎;;模糊控制在结晶器液位控制中的应用[J];包钢科技;2009年02期
7 孙伟;丰吉贺;王红岩;贺小军;;基于分散模糊控制的整车主动悬架平顺性联合仿真[J];车辆与动力技术;2009年02期
8 于锟;刘知贵;;采用粗糙集模糊模型辨识的内燃机柱塞故障诊断[J];兵工自动化;2005年05期
9 鲍立桂;杜亚欣;阮学斌;;混合参数自调整模糊PID控制在空调系统中的应用[J];兵工自动化;2009年06期
10 陈禹伶;何臻祥;;模糊PID控制在缝纫机压框调速的踏板控制系统中的应用[J];兵工自动化;2010年02期
中国重要会议论文全文数据库 前10条
1 丁丽洁;唐昊;周雷;;基于对等SAP的Q学习在机器人作业分配中的应用[A];第二十六届中国控制会议论文集[C];2007年
2 黄天云;王晓楠;陈雪波;徐望宝;;基于多任务的组群机器人系统结构分析与设计[A];第二十七届中国控制会议论文集[C];2008年
3 王红;周越;;移动机器人的分层式运动规划方法研究[A];第二十七届中国控制会议论文集[C];2008年
4 仲朝亮;刘士荣;吕强;;RobSim:一种多移动机器人仿真系统[A];第二十七届中国控制会议论文集[C];2008年
5 李磊民;刘刚;;基于MAS和传感器信息的多机器人协作研究[A];第二十七届中国控制会议论文集[C];2008年
6 毛剑琳;向凤红;冯丽辉;;一种改进的IEEE802.15.4自适应实时带宽分配策略[A];第二十七届中国控制会议论文集[C];2008年
7 马丽;刘惟一;;多个交通路口调度博弈模型及其均衡求解的增强学习算法[A];第二十七届中国控制会议论文集[C];2008年
8 ;Complexity Analysis of Quantum Reinforcement Learning[A];第二十九届中国控制会议论文集[C];2010年
9 付佳;王美玲;杨毅;周培德;;基于计算几何算法的多智能体快速编队[A];第二十九届中国控制会议论文集[C];2010年
10 王映斐;程启明;程尹曼;胡晓青;;基于模糊控制器的异步电动机直接转矩控制[A];中国自动化学会控制理论专业委员会C卷[C];2011年
中国博士学位论文全文数据库 前10条
1 张子迎;多机器人协作及环境建模技术研究[D];哈尔滨工程大学;2009年
2 王作为;具有认知能力的智能机器人行为学习方法研究[D];哈尔滨工程大学;2010年
3 高晓阳;甘肃河西大麦麦芽干燥控制系统研究[D];甘肃农业大学;2010年
4 高延增;超小型水下机器人关键性能提升技术研究[D];华南理工大学;2010年
5 黄正行;临床过程分析与优化技术研究[D];浙江大学;2010年
6 林龙信;仿生水下机器人的增强学习控制方法研究[D];国防科学技术大学;2010年
7 冯奇;POMDP近似解法研究及在中医诊疗方案优化中的应用[D];北京交通大学;2011年
8 张红亮;基于货车大型化的驼峰设计与作业控制理论研究[D];北京交通大学;2011年
9 孙祥;大学生就业区域流向及引导策略研究[D];合肥工业大学;2011年
10 王云峰;硫化镍矿选矿过程模型及优化策略研究[D];兰州理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 冯小冬;基于模糊PID控制的呼吸机压力控制研究[D];南京医科大学;2010年
2 何慧娟;基于多传感器的移动机器人障碍物检测与定位研究[D];安徽工程大学;2010年
3 张蛟龙;平面二级倒立摆的控制策略研究[D];河南理工大学;2010年
4 陈晶晶;基于模糊综合评价法的商业地产项目定位评价研究[D];浙江理工大学;2010年
5 房传礼;基于RS485总线的污水处理自动监控系统的研究[D];郑州大学;2010年
6 孔祥伟;城市二次供水智能控制系统的研究与开发[D];郑州大学;2010年
7 王巧立;微生物发酵过程的建模与优化控制研究[D];郑州大学;2010年
8 史文韬;基于DSP的水下机器人嵌入式控制系统设计[D];哈尔滨工程大学;2010年
9 万晨;船用汽轮循环泵动态仿真与优化[D];哈尔滨工程大学;2010年
10 张杰;近水面作业的机器人综合减摇机理研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 陈阳舟;黄旭;代桂平;;基于新的状态划分的多机器人围捕策略[J];北京工业大学学报;2010年08期
2 谢丽娟,陈焕文;部分可观测Markov环境下的激励学习综述[J];长沙电力学院学报(自然科学版);2002年02期
3 贾润亮;安建成;;多机器人路径规划方法研究[J];电脑开发与应用;2008年01期
4 吴元斌;;单agent强化学习与多agent强化学习比较研究[J];电脑与信息技术;2009年01期
5 缪治;邓辉宇;;多Agent系统BDI模型的推理研究[J];电脑知识与技术;2009年15期
6 刘春阳;谭应清;柳长安;马莹巍;;多智能体强化学习在足球机器人中的研究与应用[J];电子学报;2010年08期
7 李珺;潘启树;周浦城;洪炳镕;;未知环境下多机器人协作追捕算法[J];电子学报;2011年03期
8 王冲;景宁;李军;王钧;陈浩;;一种基于多Agent强化学习的多星协同任务规划算法[J];国防科技大学学报;2011年01期
9 张汝波,施洋;基于模糊Q学习的多机器人系统研究[J];哈尔滨工程大学学报;2005年04期
10 王巍;宗光华;;基于“虚拟范围”的多机器人围捕算法[J];航空学报;2007年02期
中国博士学位论文全文数据库 前5条
1 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
2 伍少成;Agent的强化学习与通信技术研究及应用[D];华南理工大学;2006年
3 殷苌茗;激励学习的若干新算法及其理论研究[D];上海大学;2006年
4 黄炳强;强化学习方法及其应用研究[D];上海交通大学;2007年
5 徐明亮;强化学习及其应用研究[D];江南大学;2010年
中国硕士学位论文全文数据库 前10条
1 伊婧;基于强化学习的机器人行为学习[D];沈阳工业大学;2011年
2 刘飞;强化学习方法在多机器人博弈系统中的应用研究[D];华北电力大学(北京);2011年
3 王国庆;RoboCup2D中的Agent带球技术研究[D];合肥工业大学;2011年
4 胡广;基于DSP的足球机器人设计与开发[D];中南大学;2002年
5 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
6 范建明;机器人足球防御仿真中强化学习方法的研究[D];大连理工大学;2006年
7 张杰;基于嵌入式系统的足球机器人小车控制器设计与研究[D];中南大学;2005年
8 王书理;机器人足球系统改进与实现的研究[D];燕山大学;2006年
9 鲍翊平;多Agent协作团队的强化学习方法研究[D];国防科学技术大学;2005年
10 李楠;基于强化学习算法的多智能体学习问题的研究[D];江南大学;2006年
【二级参考文献】
中国期刊全文数据库 前10条
1 刘峻峰,顾洋,任雪梅;基于模糊推理的踢球技术在足球机器人中的实现[J];北京理工大学学报;2003年05期
2 苗建松;孙丹丹;丁炜;;移动Adhoc网络中改进的动态源路由算法研究[J];电子科技大学学报;2008年01期
3 黄敏,佟振声;分布式多Agent系统的研究[J];电力情报;2002年01期
4 李胜,马国梁,胡维礼;基于Backstepping方法的车式移动机器人轨迹追踪控制[J];东南大学学报(自然科学版);2005年02期
5 李兰芳,刘开培,胡宇航;基于Multi-Agent的分布式变电站监控系统体系结构[J];电网技术;2003年06期
6 冯勇;廖瑞华;饶妮妮;王炜华;;基于改进蚁群算法的Ad hoc路由协议的研究[J];电子与信息学报;2008年10期
7 张建恩,曹长修,金琼;图像处理中的圆分析算法[J];重庆大学学报(自然科学版);2005年11期
8 宋健;智能控制──超越世纪的目标──国际自动控制联合会第14次代表大会报告[J];中国工程科学;1999年01期
9 曹志强,张斌,谭民;基于行为的多移动机器人实时队形保持[J];高技术通讯;2001年10期
10 王越超,谈大龙,黄闪,栾天,赵忆文;一个多智能体机器人协作装配系统[J];高技术通讯;1998年07期
中国博士学位论文全文数据库 前7条
1 徐昕;增强学习及其在移动机器人导航与控制中的应用研究[D];国防科学技术大学;2002年
2 薛宏涛;基于协进化机制的多智能体系统体系结构及多智能体协作方法研究[D];中国人民解放军国防科学技术大学;2002年
3 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
4 刘淑华;复杂动态环境下多机器人的运动协调研究[D];吉林大学;2005年
5 王醒策;基于强化学习和群集智能方法的多机器人协作协调研究[D];哈尔滨工程大学;2005年
6 夏娜;分布式智能系统中联盟机制研究[D];合肥工业大学;2005年
7 董炀斌;多机器人系统的协作研究[D];浙江大学;2006年
中国硕士学位论文全文数据库 前10条
1 张进;基于智能体的多机器人协作的仿真系统[D];南京理工大学;2003年
2 陈雪江;基于强化学习的多机器人协作机制研究[D];浙江工业大学;2004年
3 赵剑;基于一种混合遗传算法的模糊控制器的研究[D];武汉科技大学;2004年
4 肖飞;类圆形目标识别方法研究及系统实现[D];中南大学;2004年
5 徐莉;Q-learning研究及其在AUV局部路径规划中的应用[D];哈尔滨工程大学;2004年
6 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
7 虞靖靓;基于Q学习的Agent智能决策的研究与实现[D];合肥工业大学;2005年
8 崔月盟;基于强化学习和视觉导航的移动机器人控制[D];河北工业大学;2005年
9 严卉;基于视觉的轮式移动机器人目标跟踪技术研究[D];南京理工大学;2005年
10 孙晓辉;基于MAS的多机器人系统的研究与仿真[D];哈尔滨工程大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 姜健;赵杰;臧希喆;;基于并列选择遗传算法的多机器人协作探测[J];计算机工程与设计;2008年05期
2 伍明;孙继银;;基于极限环的多机器人协作围捕算法[J];微计算机信息;2010年20期
3 刘利枚;蔡自兴;;粒子群优化的多机器人协作定位方法[J];中南大学学报(自然科学版);2011年03期
4 林凤涛;刘乐平;;基于蚁群算法的多机器人协作研究[J];机床与液压;2008年08期
5 王梅,吴铁军;多机器人协作运动规划及相关问题研究[J];制造业自动化;2005年05期
6 ;第一届中欧智能系统及机器人国际学术研讨会[J];智能系统学报;2008年04期
7 孟庆鑫,李平,郭黎滨,王立权;多机器人协作技术分析及其实验系统设计[J];制造业自动化;2004年11期
8 姜健;闫继宏;臧希喆;赵杰;;基于信息素的多机器人协作任务分配[J];计算机工程与应用;2008年02期
9 王硕,范永,谭民;基于遗传算法的参数优化在多移动机器人系统中的应用[J];自动化学报;2002年04期
10 孟伟,洪炳镕,韩学东;一种多机器人协作控制方法[J];机器人;2004年01期
中国重要会议论文全文数据库 前10条
1 李磊民;刘刚;;基于MAS和传感器信息的多机器人协作研究[A];第二十七届中国控制会议论文集[C];2008年
2 刘满强;周红莉;;基于Internet的多机器人协作通信策略设计[A];第二十届中国(天津)'2006IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2006年
3 刘满强;周红莉;;基于Internet的多机器人协作通信策略设计[A];第二十届中国(天津)’2006IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2006年
4 孙凤池;殷爱茹;;一种基于SCADA的远程监控多机器人协作系统设计[A];2001年中国智能自动化会议论文集(上册)[C];2001年
5 章苏书;吴敏;曹卫华;;混合体系结构在多足球机器人协作中的应用研究[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
6 付佳;王美玲;杨毅;周培德;;基于计算几何算法的多智能体快速编队[A];第二十九届中国控制会议论文集[C];2010年
7 王晨;谢广明;王龙;;基于全局视觉的机器人水球比赛[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
8 赵杰;闫继宏;朱延河;高胜;高永生;;基于Internet多机器人遥操作系统的研究[A];第12届全国电气自动化与电控系统学术年会论文集[C];2004年
9 夏治强;王曼琳;梁赤勇;;化生放核事件的危害与机器人在化生放核事件中的应用[A];2011中国环境科学学会学术年会论文集(第四卷)[C];2011年
10 吴仲城;葛运建;戈瑜;;机器人技术是先进制造业发展的基础[A];2004“安徽制造业发展”博士科技论坛论文集[C];2004年
中国重要报纸全文数据库 前10条
1 本报记者 何腾江 实习生 陈施雅;机器人技术如何与地方产业有机结合[N];中山日报;2008年
2 记者 杨文利;中国首次举办大规模机器人技术研讨会[N];中国高新技术产业导报;2009年
3 见习记者 王音 记者 张雯婧;青少年机器人竞赛活动研究培训中心在津落户[N];天津日报;2011年
4 本报首席记者 姜澎;给机器人做规矩,要赶紧了?[N];文汇报;2011年
5 本报记者 李响;机器人的“儿童期”[N];计算机世界;2011年
6 本报驻美国记者 管克江;机器人技术日新月异[N];人民日报;2009年
7 特派记者 尤志卉;机器人技术成合作要点[N];苏州日报;2010年
8 张红 黄京一;“做我们自己的机器人”[N];人民日报海外版;2010年
9 本报记者 程宇婕;我国将建全球最大基地[N];中国能源报;2010年
10 深圳商报记者 吴素红;美女机器人“秀外慧中”[N];深圳商报;2010年
中国博士学位论文全文数据库 前10条
1 张子迎;多机器人协作及环境建模技术研究[D];哈尔滨工程大学;2009年
2 蔡云飞;多机器人协作定位及系统架构研究[D];南京理工大学;2011年
3 刘亚波;异构多机器人系统协同技术研究[D];浙江大学;2011年
4 杨锦园;基于传感器管理的移动机器人融合算法研究[D];华中科技大学;2010年
5 杨东勇;多机器人协作的学习与进化方法[D];浙江大学;2005年
6 范波;基于Agent的多机器人信息融合与协调研究[D];西北工业大学;2004年
7 刘佰龙;群集智能理论及其在多机器人系统中的应用研究[D];哈尔滨工程大学;2009年
8 石朝侠;基于多机器人协作的未知环境下路径探索研究[D];哈尔滨工业大学;2007年
9 罗真;对抗性环境下多机器人协作关键技术的研究[D];上海交通大学;2007年
10 Dioubate Mamady I;基于进化免疫系统理论的多机器人协作和机器人目标探索研究[D];中南大学;2009年
中国硕士学位论文全文数据库 前10条
1 冯睿;基于蚁群算法的多机器人协作机制研究[D];西北大学;2011年
2 姜新丽;基于强化学习的多机器人协作控制方法研究[D];沈阳理工大学;2010年
3 朱宁宁;基于强化学习的多机器人协作研究[D];兰州理工大学;2012年
4 赵鹏翀;一种基于粒子群算法的机器人群体地形探索研究[D];上海交通大学;2010年
5 龚荣;基于Agent的多机器人协作研究与仿真[D];沈阳工业大学;2011年
6 马斌奇;多机器人协作与控制策略研究[D];西安电子科技大学;2009年
7 张家飞;机器人群体协同任务规划与协调避碰[D];哈尔滨工程大学;2010年
8 李强;基于多智能体系统的机器人队形控制与协作研究[D];江南大学;2011年
9 于宝庆;基于扩展卡尔曼滤波的多机器人协作定位[D];大连理工大学;2008年
10 刘显荣;多机器人协作定位技术及在机器人编队中的应用[D];华南理工大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026