收藏本站
《吉林大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

多机器人系统自主协作控制与强化学习研究

祖丽楠  
【摘要】: 本文研究了复杂动态环境下多机器人系统的协作机制以及如何通过强化学习实现机器人的自主规划。提出了适用于组织大规模机器人群体的体系结构,实现了多机器人系统任务级的协作与运动级的协调。对于任务级的协作,首先针对静态任务分配问题提出了一种解决小规模任务分配问题的方法,并将匈牙利方法应用于多机器人系统解决了中等规模任务分配问题;其次,针对动态任务分配问题设计了一种适用于多机器人系统的分布式任务分配机制。对于运动级的协调,首先在采用了“全局规划—局部修正”的路径规划结构基础上,设计了一种基于预测的冲突消解策略作为了局部规划方法;其次,基于强化学习理论提出了一种分层学习方法实现了机器人的自主规划。为了验证所提算法的有效性,开发了一个通用的分布式多机器人仿真环境,并进行了大量的仿真实验研究。实验结果表明,任务分配方法能够满足静态任务分配的实时性与最优性要求,以及动态任务分配的自主性与鲁棒性要求,冲突消解方法具有较高的协调性,基于强化学习的避碰策略能够有效地实现机器人的自主规划并提高了其对环境的适应能力。
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:TP242

【引证文献】
中国博士学位论文全文数据库 前2条
1 杨茂;群体机器人系统分布式协同控制方法与协同行为分析[D];吉林大学;2010年
2 杨斯博;基于自组织多Agent系统的智能控制与决策研究[D];天津大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 高志军,颜国正,丁国清,颜德田,陈忠泽;多机器人协调与合作系统的研究现状和发展[J];光学精密工程;2001年02期
2 高阳,周志华,何佳洲,陈世福;基于Markov对策的多Agent强化学习模型及算法研究[J];计算机研究与发展;2000年03期
3 祖丽楠;田彦涛;梅昊;;基于分层强化学习的多移动机器人避障算法[J];吉林大学学报(工学版);2006年S2期
4 袁曾任,高明;在动态环境中移动机器人导航和避碰的一种新方法[J];机器人;2000年02期
5 李实,徐旭明,叶榛,孙增圻;国际机器人足球比赛及其相关技术[J];机器人;2000年05期
6 谭民,范永,徐国华;机器人群体协作与控制的研究[J];机器人;2001年02期
7 王军,苏剑波,席裕庚;多传感器集成与融合概述[J];机器人;2001年02期
8 庄晓东,孟庆春,殷波,王汝霖,熊建设,王旭柱;动态环境中基于模糊概念的机器人路径搜索方法[J];机器人;2001年05期
9 张芳,林良明;多移动机器人协调系统体系结构与相关问题[J];机器人;2001年06期
10 王卫华,陈卫东,席裕庚;基于不确定信息的移动机器人地图创建研究进展[J];机器人;2001年06期
中国博士学位论文全文数据库 前1条
1 刘淑华;复杂动态环境下多机器人的运动协调研究[D];吉林大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 张峰;王金超;陈雪波;;机器人队形控制中的二叉树方法[J];辽宁科技大学学报;2010年05期
2 承向军,杨肇夏;基于多智能体技术的城市交通控制系统的探讨[J];北方交通大学学报;2002年05期
3 张冬梅;刘强;;一种基于强化学习的传感器网络应用重构决策方法[J];北京交通大学学报;2010年03期
4 罗天德,孔莲芳;基于层次结构的分布式MAS作战防御体系[J];兵工自动化;2004年05期
5 黄岩;吴军;刘春明;李兆斌;;自主车辆发展概况及关键技术[J];兵工自动化;2010年11期
6 柴仲明;禹梅;刘舒;;基于遗传算法的机器鱼路径规划[J];兵工自动化;2010年11期
7 杨萍;毕义明;孙淑玲;;具有自主决策能力的机动单元智能体研究[J];兵工学报;2007年11期
8 赵晓华;李振龙;于泉;张杰;;基于切换模型的两交叉口信号灯Q学习协调控制[J];北京工业大学学报;2007年11期
9 王正光,张奇志;基于RoboCup仿真机器人决策系统设计方法[J];北京机械工业学院学报;2003年03期
10 郑延斌;赵沁平;;一种团队自治实体路径规划算法TAEPP[J];北京航空航天大学学报;2008年06期
中国博士学位论文全文数据库 前10条
1 王玉全;基于全景视觉的移动机器人同时定位与地图创建方法研究[D];哈尔滨工程大学;2010年
2 张子迎;多机器人协作及环境建模技术研究[D];哈尔滨工程大学;2009年
3 王作为;具有认知能力的智能机器人行为学习方法研究[D];哈尔滨工程大学;2010年
4 陈得宇;基于MAS的智能电压控制系统研究[D];哈尔滨工程大学;2010年
5 杨锦园;基于传感器管理的移动机器人融合算法研究[D];华中科技大学;2010年
6 蒋国银;基于集成模拟的电子商务协同工作机制研究[D];华中科技大学;2010年
7 高延增;超小型水下机器人关键性能提升技术研究[D];华南理工大学;2010年
8 李雄;飞行危险天气下的航班改航路径规划研究[D];南京航空航天大学;2009年
9 张洪海;机场终端区协同流量管理关键技术研究[D];南京航空航天大学;2009年
10 钟鸣;移动式微小型自重构机器人系统研究[D];哈尔滨工业大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 承向军,杨肇夏;基于多智能体技术的城市交通控制系统的探讨[J];北方交通大学学报;2002年05期
2 张飞舟;曹学军;孙敏;;基于多智能体的城市交通集成控制系统设计[J];北京大学学报(自然科学版);2008年02期
3 李舜酩;沈峘;毛建国;辛江慧;缪小东;;智能车辆发展及其关键技术研究现状[J];传感器与微系统;2009年01期
4 李晖;贾辉然;牛晓辉;宋士普;;智能交通系统的研究现状及发展趋势[J];产业与科技论坛;2008年08期
5 刘成林;田玉平;;具有不同通信时延的多个体系统的一致性[J];东南大学学报(自然科学版);2008年01期
6 欧海涛,张卫东,张文渊,许晓鸣;基于多智能体技术的城市智能交通控制系统[J];电子学报;2000年12期
7 杨丽艳;郑毓蕃;;带有一般非线性结构的觅食群体的稳定性分析[J];复杂系统与复杂性科学;2009年02期
8 ;中国智能交通的现状和发展[J];高科技与产业化;2008年06期
9 王荣本,李兵,施树明,李斌;世界智能车辆研究概述[J];公路交通科技;2001年05期
10 张明路,戈新良,唐智强,刘兴荣;多传感器信息融合技术研究现状和发展趋势[J];河北工业大学学报;2003年02期
中国博士学位论文全文数据库 前10条
1 文敦伟;面向多智能体和神经网络的智能控制研究[D];中南大学;2001年
2 邓宏钟;基于多智能体的整体建模仿真方法及其应用研究[D];国防科学技术大学;2002年
3 李常洪;多Agent合作机制与合作结构研究[D];天津大学;2003年
4 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
5 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
6 王长缨;多agent协作团队的学习方法研究[D];国防科学技术大学;2004年
7 钟伟才;多智能体进化模型和算法研究[D];西安电子科技大学;2004年
8 刘静;协同进化算法及其应用研究[D];西安电子科技大学;2004年
9 范波;基于Agent的多机器人信息融合与协调研究[D];西北工业大学;2004年
10 钟一文;智能优化方法及其应用研究[D];浙江大学;2005年
【二级引证文献】
中国期刊全文数据库 前2条
1 段俊花;朱怡安;钟冬;;群智能在多智能体系统中的应用研究进展[J];计算机科学;2012年06期
2 岑琴;刘丽娜;叶依如;;多Agent的机器人系统在图书归类中的应用[J];计算机系统应用;2011年08期
中国博士学位论文全文数据库 前1条
1 杨茂;群体机器人系统分布式协同控制方法与协同行为分析[D];吉林大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 马明山,朱绍文,何克忠,李相伟;室外移动机器人定位技术研究[J];电工技术学报;1998年02期
2 黄敏,佟振声;分布式多Agent系统的研究[J];电力情报;2002年01期
3 钟碧良,张祺,杨宜民;足球机器人系统控制结构的研究与协作实现[J];电路与系统学报;2003年04期
4 王国胜,钟义信;支持向量机的若干新进展[J];电子学报;2001年10期
5 袁南儿;计算机控制策略的发展、渗透和复合[J];工业仪表与自动化装置;1998年06期
6 宋梅萍,顾国昌,张汝波;移动机器人的自适应式行为融合方法[J];哈尔滨工程大学学报;2005年05期
7 姜若愚,范丰仙;智能机器人传感器的研究述评[J];湖南大学学报(自然科学版);1994年05期
8 李瑞峰,李伟招;基于多传感器信息融合的移动机器人路径规划[J];机电一体化;2002年04期
9 高阳,周志华,何佳洲,陈世福;基于Markov对策的多Agent强化学习模型及算法研究[J];计算机研究与发展;2000年03期
10 ;计算机科学丛书[J];计算机研究与发展;2000年04期
【相似文献】
中国期刊全文数据库 前10条
1 卞凯;;基于强化学习的城市交通区域协调控制研究[J];电子技术;2011年08期
2 李蕊;雷群泌;;一种面向汽车系统可靠性优化的任务分配方法[J];计算机应用研究;2011年07期
3 夏丽丽;;连续状态-连续行动强化学习[J];电脑知识与技术;2011年19期
4 祝宇虹;毛俊鑫;;基于人工情感与Q学习的机器人行为决策[J];机械与电子;2011年07期
5 刘卫红;周义莲;;强化学习方法在Web服务组合中的应用比较研究[J];计算机应用与软件;2011年07期
6 何凤英;;地震噪声成像系统中任务分配算法研究[J];计算机应用与软件;2011年08期
7 黄付亮;张荣国;陈大川;刘焜;;基于联合博弈的多Agent学习[J];计算机与数字工程;2011年06期
8 马永刚;谭国真;王启冬;;基于0-1规划的并行计算图划分模型[J];小型微型计算机系统;2011年08期
9 张文柱;邵丽娜;;异构无线网络中基于强化学习的频谱管理算法[J];西安电子科技大学学报;2011年04期
10 骆万文;沈承东;马常楼;;基于应用特征的启发式可重构SoC任务分配[J];科技资讯;2011年22期
中国重要会议论文全文数据库 前10条
1 鄢超波;赵千川;;任务分配问题的研究进展与算法比较[A];第二十七届中国控制会议论文集[C];2008年
2 陈俊刚;洪春辉;唐歌实;刘成军;;基于冲突消解的深空测控网资源调度算法研究[A];中国宇航学会深空探测技术专业委员会第七届学术年会论文集[C];2010年
3 柳林;郑志强;;多机器人任务分配技术及其在机器人足球中应用[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
4 文锋;陈宗海;陈春林;;基于RLS-TD和值梯度的强化学习方法用于LQR控制问题[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
5 卓睿;陈宗海;陈春林;;强化学习在移动机器人导航上的应用[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
6 殷波;孟庆春;庄晓东;;基于模糊逻辑的多机器人系统智能学习方法[A];2005年中国智能自动化会议论文集[C];2005年
7 杨茂;田彦涛;杨永明;刘宗春;;基于改进粒子群优化算法的多机器人合作Q学习[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
8 曹志强;王硕;张斌;谭民;;复杂未知环境下多移动机器人队形控制[A];钱学森科学贡献暨学术思想研讨会论文集[C];2001年
9 张伟;李建更;张家旺;;多智能体强化学习在机器人足球比赛中的应用[A];2005年中国智能自动化会议论文集[C];2005年
10 任燚;陈宗海;;一种强化学习算法应用于多移动机器人的觅食实例研究[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
2 编译 王金元;蚂蚁机器人将会钻入人体内[N];北京科技报;2005年
3 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
4 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
5 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
6 李北川;强化学习 找准问题 着力整改[N];凉山日报(汉);2007年
7 记者 刘莉 实习记者 刘慕欣;兵团党委“保先”教育活动督导组强化学习[N];兵团日报(汉);2005年
8 陈滟澎 张玮(作者单位:市交通局公路处);强化学习提高机关办事效能[N];廊坊日报;2006年
9 记者王旭燕、实习生张娜;强化学习抓好落实 确保完成全年目标任务[N];铜川日报;2009年
10 关真付;唐山市文化局强化学习狠抓落实[N];中国文化报;2003年
中国博士学位论文全文数据库 前10条
1 祖丽楠;多机器人系统自主协作控制与强化学习研究[D];吉林大学;2006年
2 姜健;多移动机器人协作方法研究[D];哈尔滨工业大学;2008年
3 严勇杰;多机器人系统协调与控制研究[D];哈尔滨工程大学;2007年
4 杨永明;群体机器人系统协同行为研究[D];吉林大学;2009年
5 董炀斌;多机器人系统的协作研究[D];浙江大学;2006年
6 范波;基于Agent的多机器人信息融合与协调研究[D];西北工业大学;2004年
7 柳林;多机器人系统任务分配及编队控制研究[D];国防科学技术大学;2006年
8 刘亚波;异构多机器人系统协同技术研究[D];浙江大学;2011年
9 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
10 秦元庆;多移动机器人系统运动控制研究[D];华中科技大学;2007年
中国硕士学位论文全文数据库 前10条
1 齐心跃;基于强化学习的多机器人任务分配算法研究[D];吉林大学;2008年
2 尹香花;基于强化学习的多机器人行为式队形控制策略研究[D];吉林大学;2009年
3 梅昊;群体机器人系统协同适应性研究[D];吉林大学;2007年
4 徐菊香;动态环境下多智能体系统的任务分配与协作研究[D];江南大学;2009年
5 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
6 李钦鹏;基于行为和学习机制的多机器人协作策略研究[D];南京理工大学;2008年
7 谭应清;基于MAS的机器人动态博弈系统协作策略研究[D];华北电力大学(北京);2009年
8 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
9 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
10 郭一明;基于强化学习的劣化系统维修策略研究[D];合肥工业大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026