收藏本站
《合肥工业大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

Agent个体学习与多Agent协作的研究及其在RoboCup中的应用

王骋  
【摘要】: 近年来,有关多agent系统与分布式人工智能的研究,已经成为人工智能领域的重要研究方向之一。多agent系统以人类社会为参考目标,重点研究集体的智能行为。 RoboCup(robot world cup),即机器人世界杯足球赛,是典型的多agent系统。人们通过对机器人足球赛的研究,探索多个机器人之间的合作与协调关系。机器人足球队为了能够完成实际的比赛任务,需要结合多种技术,包括自主机器人的设计、多agent的合作与协调、决策调度、实时推理、机器人学和传感技术等。RoboCup作为人工智能和机器人学新的标准问题,己受到越来越广泛的关注。 在RoboCup中要想构建一支完整的球队,主要有两方面的工作:获得球员的个体动作以及在多个球员之间进行合作。本文就是从这两个方面展开研究。 所谓的个体动作指的是由服务器提供的若干个动作命令组合起来实现的一个足球运动员的实际动作,比如射门、截球、传球等。本文重点研究两种神经网络算法:BP算法和RBF算法,使用这两种学习算法解决射门问题和传球问题。 多个球员之间的合作属于多agent协作问题,即如何把所有球员有效的组织起来争取比赛的胜利。协作图是一种解决协作问题的新方法,它将全局的协作问题分解为若干个局部协作问题,大大减小了agent需要选择的动作空间。但是协作图要求离散状态变量,所以无法直接应用到类似RoboCup这种通讯条件受到限制的连续状态空间。为此,本文提出基于角色的协作图,并对协作图中用来计算联合动作的变量消减算法加以改进。在RoboCup中使用基于值规则的协作图实现了球员在对方禁区内的动作选择。
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:TP242

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前3条
1 王军;基于分层强化学习的RoboCup 3D球队的设计与实现[D];江苏大学;2006年
2 魏涛;RoboCup仿真球队的研究与实现[D];南京理工大学;2007年
3 李佳;基于XBRL的PDF财务报告信息处理方法及实现研究[D];华东师范大学;2013年
【参考文献】
中国期刊全文数据库 前1条
1 李实,陈江,孙增圻;清华机器人足球队的结构设计与实现[J];清华大学学报(自然科学版);2001年07期
【共引文献】
中国期刊全文数据库 前10条
1 郑浩,王全凤;L-M算法在高层结构体系选型中的应用[J];四川建筑科学研究;2003年03期
2 薛宏伟;芜湖电厂给水控制和主汽温控制改造[J];安徽电气工程职业技术学院学报;2005年03期
3 蒋有光;;往复双动采茶机切割器最佳设计参数的研究[J];安徽工学院学报;1986年01期
4 许德生;浆纱工艺参数的优化设计[J];安徽机电学院学报;1996年01期
5 李兴旺,满广生;工程结构优化的神经网络模型与数值计算[J];安徽建筑工业学院学报(自然科学版);2002年02期
6 张润梅,龚剑,章曙光;机器人足球队的结构设计研究[J];安徽建筑工业学院学报(自然科学版);2003年01期
7 龚剑;关于高校开展机器人足球比赛的思考[J];安徽建筑工业学院学报(自然科学版);2005年04期
8 高朋;黄世祥;;地区现代化水平BP人工神经网络评价方法初探[J];安徽农业大学学报(社会科学版);2006年03期
9 陈红琳;;基于MAS的农产品供应链可追溯系统研究[J];安徽农业科学;2011年35期
10 曹永涛 ,陈海清 ,周开基 ,郑生全;电磁兼容专家系统框架研究[J];安全与电磁兼容;2004年01期
中国重要会议论文全文数据库 前10条
1 沈霖;吴蕙;张帆;张芸;;提高有限元网格自动剖分成功率的研究[A];首届中国CAE工程分析技术年会暨2005全国计算机辅助工程(CAE)技术与应用高级研讨会论文集[C];2005年
2 段书凯;刘光远;;网络参数对混沌联想记忆特性的影响[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
3 鲍林江;贾世发;;电网经济运行实时分析监测系统的研究[A];2003中国电机工程学会电力系统自动化专委会供用电管理自动化分专业委员会成立暨第一届学术交流会议论文集[C];2003年
4 张影;;基于Oracle的空间碎片减缓设计专家数据库系统[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
5 刘海芳;陈正军;潘小勇;张海荣;胡国林;;Al方法在梭式窑温度控制中的应用[A];中国硅酸盐学会陶瓷分会2009年年会论文集(一)[C];2009年
6 李勤丰;;最大独立集在高校排课表系统中的应用[A];广西计算机学会2006年年会论文集[C];2006年
7 索雪松;索雪峰;李阳;张曙光;;漏水声波数据可信度的模糊推理过程[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
8 刘明贵;岳向红;杨永波;李祺;;基于Sym小波和BP神经网络的基桩缺陷智能化识别[A];2007'湖北·武汉NDT学术年会论文集[C];2007年
9 谢进;阎开印;陈永;;应用于平面机构综合中的神经网络技术[A];第十三届全国机构学学术研讨会论文集[C];2002年
10 刘永;张立毅;;基于遗传神经网络盲均衡算法的研究[A];2006中国西部青年通信学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 陈韶斌;基于知识推理和视觉机理的遥感图像目标识别方法研究[D];华中科技大学;2010年
2 朱松;随机回归神经网络的动力学行为研究[D];华中科技大学;2010年
3 杨红;污水生化处理的智能建模与优化控制策略应用研究[D];华南理工大学;2010年
4 吴修国;面向目标的迁移工作流建模方法研究[D];山东大学;2010年
5 李俊花;长输液体管道泄漏监测方法研究[D];大连理工大学;2006年
6 张冰战;插电式混合动力电动汽车能量管理策略研究[D];合肥工业大学;2011年
7 徐菲;用于检测三维力的柔性触觉传感器结构及解耦方法研究[D];中国科学技术大学;2011年
8 张彩珍;太阳能级硅(SOG-Si)光伏电池中多孔硅吸杂工艺及其神经网络分析方法研究[D];兰州大学;2011年
9 薛颂东;面向目标搜索的群机器人协调控制及其仿真研究[D];兰州理工大学;2009年
10 陈佳林;柔性逻辑的健全性研究与应用[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 何慧娟;基于多传感器的移动机器人障碍物检测与定位研究[D];安徽工程大学;2010年
2 滕景忠;智能瓦斯传感器的研制[D];山东科技大学;2010年
3 陈少华;基于Hopfield神经网络控制系统的研究[D];山东科技大学;2010年
4 程慧;基于神经网络的两类问题研究[D];广西师范学院;2010年
5 张杰;近水面作业的机器人综合减摇机理研究[D];哈尔滨工程大学;2010年
6 王洋;基于潜在语义分析的智能搜索技术研究[D];哈尔滨工程大学;2010年
7 林华云;蒸汽发生器检修机械臂的视觉测量研究[D];哈尔滨工程大学;2010年
8 尹继超;机器人遥操作中关键技术的研究[D];哈尔滨工程大学;2010年
9 孙敬武;基于周期图和神经网络船舶运动预报方法研究[D];哈尔滨工程大学;2010年
10 王东阳;多智能体调度优化算法研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 沈颖玲;XBRL:存取网络财务报告的创新[J];财经论丛(浙江财经学院学报);2002年04期
2 葛锐 ,徐静;XBRL的技术基础分析[J];财会通讯;2005年03期
3 肖美英;王宗宗;;基于混合数据库存储的XBRL财务信息管理体系探讨[J];财会通讯;2011年07期
4 张天西,杨海峰;网络财务报告改革:利益相关者的态度研究——基于问卷调查数据的实证分析[J];当代经济科学;2004年05期
5 方玮玮;;机器学习方法浅析[J];福建电脑;2006年11期
6 苏秀花;;XBRL基本框架的理论探讨[J];中国管理信息化(综合版);2006年02期
7 杨风雷;郑娅峰;;XBRL在网络财务报告中的应用[J];光盘技术;2006年04期
8 张志强,李天柱,张波,陈少飞,郝亚南;基于文档结构的信息抽取规则的描述语言比较研究[J];河北大学学报(自然科学版);2004年02期
9 刘春阳,柳长安,吴克河;足球机器人的防守策略设计与分析[J];哈尔滨工业大学学报;2004年07期
10 初旭新,韩光胜;LWR学习在足球机器人中的应用[J];哈尔滨工业大学学报;2005年07期
中国重要会议论文全文数据库 前3条
1 韩光强;;新会计准则实施背景下XBRL在企业中应用研究[A];第九届全国会计信息化年会论文集(上)[C];2010年
2 闫萍;;基于XBRL网络财务报告模式的应用研究[A];第十届全国会计信息化年会论文集[C];2011年
3 欧阳电平;周舟;;基于XBRL的报表附注表述的规范需求与现状分析——以房地产业销售与收款业务为例[A];第九届全国会计信息化年会论文集(上)[C];2010年
中国博士学位论文全文数据库 前2条
1 吕志明;XBRL财务报告研究[D];天津财经大学;2011年
2 薛方正;足球机器人对抗策略研究与仿真系统开发[D];东北大学;2005年
中国硕士学位论文全文数据库 前10条
1 王颖;基于XBRL的网络财务报告在上市公司的应用研究[D];哈尔滨理工大学;2010年
2 王江泰;基于PDF文档数字水印算法研究[D];西北师范大学;2010年
3 夏旻;机器人足球系统的策略研究[D];中国人民解放军国防科学技术大学;2002年
4 郭叶军;机器人足球仿真比赛中多智能体系统的构建[D];浙江大学;2004年
5 张颖霞;机器人足球仿真比赛系统结构与设计的研究[D];广东工业大学;2004年
6 杨增光;智能Agent的研究与实践[D];安徽大学;2004年
7 赵斌;RoboCup仿真机器人足球赛研究[D];昆明理工大学;2004年
8 仵博;Multi-Agent协作模型及其在RoboCup中的应用[D];中南大学;2003年
9 王文凤;机器人足球(RoboCup)仿真比赛中后卫防守策略的研究与应用[D];中南大学;2004年
10 耿丽娜;RoboCup仿真组教练模型研究[D];国防科学技术大学;2003年
【二级引证文献】
中国硕士学位论文全文数据库 前4条
1 严耀华;基于个性Agent的协作强化学习模型研究[D];江苏大学;2008年
2 余倩;基于全局视觉的类人型足球机器人系统构建[D];西华大学;2009年
3 齐彦龙;基于全局视觉的类人机器人通信系统的研究[D];西华大学;2010年
4 柳云山;足球机器人路径规划与防御策略研究及软件实现[D];中南大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 潘凌寒,楚威,程显毅;基于角色的RoboCup足球策略[J];计算机工程与应用;2004年26期
2 徐勇明,张培仁,王康正,郑旭东;四轮F180型足球机器人的控制系统设计[J];机械与电子;2005年02期
3 舒文杰,耿丽娜,郑志强;RoboCup仿真研究[J];系统仿真学报;2004年10期
4 张胜利,谢培军;RoboCup机器人足球仿真比赛开发设计流程[J];信息技术;2003年12期
5 王海玉,王磊,孙增圻;RoboCup小型组控制系统设计和实现[J];微特电机;2004年06期
6 姚望舒,沈建强,李宁,陈兆乾;BP神经网络容噪性分析及其应用[J];小型微型计算机系统;2005年04期
7 杨佩,赵志宏,陈兆乾;NDSocTeam仿真机器人足球队的设计和实现[J];南京大学学报(自然科学版);2003年05期
8 张润梅,龚剑,章曙光;机器人足球赛相关技术研究[J];安徽工程科技学院学报(自然科学版);2003年02期
9 王昌达,程显毅,赵曦滨;基于Agent的RoboCup数学建模[J];计算机工程与应用;2003年10期
10 李静,骆斌,陈兆乾,陈世福;RoboCup中基于效果操作的动态行为规划模型[J];南京大学学报(自然科学版);2003年05期
中国重要会议论文全文数据库 前10条
1 ;Investigation on A New Kick Equipment with Two Degrees of Freedom Controlled by FPGAfor RoboCup[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
2 刘维超;;2D仿真组中关于射门方法的研究[A];2005中国机器人大赛论文集[C];2005年
3 刁建栋;高彬;沈亮;李春光;;常州工学院RoboCup-3D仿真设计[A];2005中国机器人大赛论文集[C];2005年
4 刘载文;张弢;连晓峰;;基于颜色图像分割的RoboCup中型组机器人目标识别[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
5 王军;张俊;;RoboCup 3D通信分析[A];2005中国机器人大赛论文集[C];2005年
6 张海雄;李全;朱长春;李春光;;基于BP神经网络的RoboCup铲球方法的研究[A];2005中国机器人大赛论文集[C];2005年
7 曹福召;杨正磊;李海龙;;基于UML的RoboCup小型组总控系统模型[A];2005中国机器人大赛论文集[C];2005年
8 刘斐;郑志强;;基于边缘特征的RoboCup小型组机器人定位、定向方法[A];2005中国机器人大赛论文集[C];2005年
9 敬斌;田野;;Robocup中的传球策略[A];2005中国机器人大赛论文集[C];2005年
10 许元;;RoboCup3D仿真组Agent定位研究[A];2005中国机器人大赛论文集[C];2005年
中国重要报纸全文数据库 前10条
1 记者 钱怡;苏州两万学生玩机器人[N];苏州日报;2010年
2 梁涛;太原理工大学代表队摘金又夺银[N];太原日报;2008年
3 记者 谭华健;高新精尖电子产品尽展魅力[N];中山日报;2008年
4 本报记者 陈恒才 实习生 陈施雅;机器人能否变成真正的“人”?[N];中山日报;2008年
5 杨保国;中国科大研制的机器人会说话能干活[N];科技日报;2009年
6 本报记者 许琦敏;培育大师的土壤,可以准备[N];文汇报;2011年
7 本报实习记者 李荔;会思考能推理的家庭机器人面世[N];北京科技报;2009年
8 记者 陈琳;机器人总动员[N];第一财经日报;2010年
9 谭华健 梁丽莎 黄晓忻;展示高新科技 体验智能生活[N];中山日报;2008年
10 本报记者 钱怡 徐磊;“机器人运动”喜忧录[N];苏州日报;2010年
中国博士学位论文全文数据库 前10条
1 杨莉;RoboCup小型组足球机器人路径规划关键技术研究[D];武汉理工大学;2012年
2 缪克华;Robocup3D足球机器人体系结构与基本技能的研究与实现[D];厦门大学;2008年
3 刘斐;应用于足球机器人的彩色全向视觉关键技术研究[D];国防科学技术大学;2007年
4 王长缨;多agent协作团队的学习方法研究[D];国防科学技术大学;2004年
5 姚宏亮;动态多智能体建模与决策问题研究[D];合肥工业大学;2007年
6 张良安;软袋药品生产物流系统的规划调度和控制软件设计方法研究[D];天津大学;2010年
7 卢惠民;自主移动机器人全向视觉系统研究[D];国防科学技术大学;2010年
8 吴永海;全方位移动机器人运动控制及规划[D];浙江大学;2011年
9 单黎君;图形化模型的一致性检查[D];国防科学技术大学;2008年
10 张涛;复杂信息系统模型的形式化验证方法研究[D];哈尔滨工程大学;2012年
中国硕士学位论文全文数据库 前10条
1 王骋;Agent个体学习与多Agent协作的研究及其在RoboCup中的应用[D];合肥工业大学;2004年
2 赵发君;RoboCup仿真2D系统的研究[D];安徽大学;2013年
3 刘勇;Robocup类人机器人系统研究与实现[D];大连理工大学;2010年
4 尚丽;RoboCup2D中的多Agent协作技术研究[D];合肥工业大学;2010年
5 李亘;基于单亲遗传算法的RoboCup机器人足球比赛策略研究[D];长沙理工大学;2011年
6 郑重虎;RoboCup3D仿真中双足机器人的运动规划与智能决策[D];南京邮电大学;2013年
7 欧阳敏;RoboCup中型组机器人定位与任意足球检测研究[D];长安大学;2012年
8 梁虎;RoboCup中型组机器人决策系统关键技术研究[D];长安大学;2011年
9 崔金柱;RoboCup中型组足球机器人视觉和决策系统的研究与设计[D];东北大学;2009年
10 何太云;Robocup小型组足球机器人设计与优化[D];大连理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026