收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

多智能体Q学习在多AUV协调中的应用与仿真

李锋  
【摘要】: AUV(Autonomous Underwater Vehicle,简称AUV)作为一种高技术手段,在海洋环境监测、海底资源调查、科学考察、危险环境作业和打捞救生等方面起到了至关重要的作用。随着执行任务的复杂性日益增加,单AUV在大范围内作业的时效性、鲁棒性和柔性等方面就表现出明显不足。需要多个AUV构成系统来共同完成任务,而多AUV的协调控制成为关键问题,本论文主要讨论了一种新的多AUV协调控制方法、系统设计及仿真。 本文首先介绍了多AUV技术的发展动态以及课题研究的意义,然后根据多AUV协调控制系统的需要建立AUV运动模型、多智能体Q学习模型,在此基础上建立了面向任务的多AUV系统结构。对比分析了近几年的几种重要的多智能体强化算法,然后提出了一种新的多智能体Q学习算法,这种算法结构简单,能够大大简化状态空间,加快收敛速度。试验表明,本文提出的多智能体Q学习方法是有效的。 然后对多智能体Q学习算法实现多AUV协调的系统进行了设计,用多个仿真实例说明了多智能体Q学习算法在多AUV系统中的应用,试验证明,此本文提出的多智能体Q学习协调算法在满足Nash均衡的同时,避免了研究多个均衡点同时存在的问题,收敛速度快并且非常有效。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 严浙平;李锋;黄宇峰;;多智能体Q学习在多AUV协调中的应用研究[J];应用科技;2008年01期
2 张驰,韩光胜;改进的模糊Q学习方法及其在RoboCup中的应用[J];计算机仿真;2005年05期
3 谭天晓;赵辉;赵宗涛;;一种基于统计的多智能体Q学习算法[J];微电子学与计算机;2008年01期
4 郭锐;吴敏;彭军;彭姣;曹卫华;;一种新的多智能体Q学习算法[J];自动化学报;2007年04期
5 范波,潘泉,张洪才;一种基于分布式强化学习的多智能体协调方法[J];计算机仿真;2005年06期
6 张杰;李秀娟;张晓东;;基于Q学习的角色分配在多智能体协作中的应用[J];光盘技术;2008年08期
7 曹卫华;徐凌云;吴敏;;模糊Q学习的足球机器人双层协作模型[J];智能系统学报;2008年03期
8 景博,李剑,钱越英;一种协商在线增量学习算法及其在基于智能体的电子商务中的应用[J];计算机工程与应用;2005年02期
9 金福江;;Agent的多目标优化分布式智能算法[J];华侨大学学报(自然科学版);2005年04期
10 朱李瑾;刘子忠;;图书馆联盟的技术构架——多智能体系统[J];图书馆论坛;2006年01期
11 马良荔,贲可荣;使用多Agent模型求解N-难题的新方法[J];海军工程学院学报;1996年04期
12 朱建伟,陈健;多智能体系统技术概论[J];机电设备;2004年03期
13 修世军;Mas冲突管理模型[J];丹东纺专学报;2005年01期
14 王健强;杜辉;于澎;;机器人点焊工作站在汽车制造中的应用[J];机器人技术与应用;2006年04期
15 沈寿林;韩晓强;白承森;;Agent技术及其在作战模拟中的应用[J];计算机仿真;2006年09期
16 倪小雷;卜佳俊;;自主移动机器人混合式体系结构的设计与实现[J];计算机测量与控制;2006年11期
17 姜玉新;王莉;;基于MAS的运输企业管理信息系统模型构建[J];鞍山科技大学学报;2007年04期
18 郭磊;陈进;王国伟;;基于多智能体的设备性能退化评估系统建模[J];计算机集成制造系统;2008年03期
19 王云;韩伟;;一种基于划分和集成思想的多智能体强化学习[J];南京师范大学学报(工程技术版);2008年04期
20 王云;韩伟;;对称协调博弈问题的多智能体强化学习[J];计算机工程与应用;2008年36期
中国重要会议论文全文数据库 前10条
1 马洁;李茂;邱国霞;张志涌;;Q学习在RoboCup个体技术中的应用[A];2005中国机器人大赛论文集[C];2005年
2 杨洪勇;路兰;李晓;;时延多智能体系统的群集运动[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
3 郭晓军;袁阳;杨建军;李红卫;;一类多智能体学习算法的研究及应用[A];2007年中国智能自动化会议论文集[C];2007年
4 张文广;郭振凯;;一类高阶多智能体系统的一致控制研究[A];中国自动化学会控制理论专业委员会C卷[C];2011年
5 姜海波;于建江;周彩根;;基于脉冲控制协议的线性离散多智能体系统的一致性[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
6 杨熙;王金枝;;多智能体系统一致性的鲁棒性分析[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
7 张亚;田玉平;;离散时间多智能体系统一致的权重条件[A];中国自动化学会控制理论专业委员会B卷[C];2011年
8 杨熙;王金枝;;Leader-Follower结构下多智能体系统一致性的鲁棒性能分析[A];第二十九届中国控制会议论文集[C];2010年
9 张衡;程显毅;张吉刚;陈小波;;基于Q学习的足球机器人协作策略[A];2005中国机器人大赛论文集[C];2005年
10 薛栋;姚静;余有灵;胡俊杰;;具有切换拓扑和非线性环节的关联多智能体系统一致性分析[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
中国博士学位论文全文数据库 前10条
1 吴治海;网络环境下的多智能体系统一致性问题研究[D];华中科技大学;2011年
2 王强;低阶多智能体系统分析与控制协议设计[D];山东大学;2012年
3 佘莹莹;多智能体系统一致性若干问题的研究[D];华中科技大学;2010年
4 姜海波;多智能体系统的脉冲一致性及其动力学研究[D];江苏大学;2012年
5 唐朝君;多智能体系统一致性问题与包含控制问题研究[D];电子科技大学;2012年
6 潘福臣;多智能体系统的稳定性研究及其在人工股票市场上的应用[D];大连理工大学;2011年
7 彭科;带领导者的多智能体系统中的一致性问题研究[D];上海交通大学;2009年
8 吴锋;基于决策理论的多智能体系统规划问题研究[D];中国科学技术大学;2011年
9 戴朝晖;基于混合抽象机制的多智能体系统动态分层强化学习算法研究[D];中南大学;2012年
10 李扬;网络环境下多智能体协调控制研究[D];中国海洋大学;2012年
中国硕士学位论文全文数据库 前10条
1 李锋;多智能体Q学习在多AUV协调中的应用与仿真[D];哈尔滨工程大学;2008年
2 尚旭辉;TSR-1足球机器人底层控制系统及通讯子系统的研究[D];天津大学;2004年
3 祖丽楠;多智能体分布式实时仿真实验系统开发与规划算法研究[D];吉林大学;2004年
4 王家凡;基于多智能体的交通流微观仿真[D];中南大学;2004年
5 邱宇航;协作协进化算法应用于多智能体协作的研究[D];浙江工业大学;2005年
6 张晓勇;RoboCup中多智能体系统协作的研究与实现[D];中南大学;2005年
7 秦志斌;自主移动机器人高可靠性软件体系结构研究[D];浙江大学;2006年
8 张驰;基于ROBOCUP的多智能体系统设计与实现[D];北京工业大学;2004年
9 杨俊卿;多移动机器人围捕算法的研究[D];山东科技大学;2005年
10 朱莹莹;基于Multi-Agent仿真机器人足球比赛策略研究与开发[D];华北电力大学(北京);2006年
中国重要报纸全文数据库 前4条
1 ;多智能体系统开发环境(MBOS)[N];计算机世界;2001年
2 记者 俞路石;中科大研制出智能服务机器人[N];中国教育报;2009年
3 记者 吴长锋;中科大机器人“可佳”能思考会推理[N];科技日报;2009年
4 记者 桂运安;“机器人世界杯”科大摘金夺银[N];安徽日报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978