收藏本站
《南京邮电大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

基于机器学习的3D仿真足球机器人动作与协作优化

冯欢欢  
【摘要】:本文在RoboCup3D仿真平台中,实现建立了高通量计算机集群HTCondor系统,并在此基础上建立了Robocup3D个体机器人的动作优化机制,对机器人的踢球及行走参数进行了训练优化,其次基于足球队伍的阵型及角色分配两个问题研究了动态环境中多智能体的有效协作对抗策略。个体机器人的动作优化问题中,由于单机优化速度较慢,采用高吞吐量计算机集群系统分配网络资源,缩短优化时间;其次利用CMA-ES算法,对5类机器人的踢球动作进行了优化,使用该算法的增强学习训练框架,成功地优化了机器人的远射及快踢动作。针对机器人行走优化对单一训练任务过拟合的问题,设计了多个子任务和多个子参数集的分层学习方法,全面提升了5类机器人的行走、转弯和带球的机动性和稳定性。多智能体的协作对抗策略中,分别针对足球队伍的阵型优化和多智能体的角色分配优化问题进行了研究。首先基于Delaunay三角网对足球场进行了剖分,并采用基于形势的阵型机制(SBSP)对足球队伍的阵型进行了设计,有效实现了足球在关键位置的足球队伍整体阵型的多样化;在阵型确定的基础上,利用Markov决策过程(MDP)模型,对机器人队伍的角色分配进行了优化,综合考虑仿真环境中5种不同类型的机器人的距离、朝向、是否跌倒、速度等影响因素,利用线性函数近似的Sarsa(?)学习算法对MDP模型中的动作值函数进行求解,寻找最优的角色分配方案,提高了团队的整体进攻防守效率。经过多次实验证明,本文的研究对于Apollo3D队伍的个体机器人以及整体队伍的阵型分配及角色轮换方面有着较大的提升。
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP242

手机知网App
【参考文献】
中国期刊全文数据库 前8条
1 吕家杰;王改云;;机器人足球智能体行为选择策略仿真研究[J];计算机仿真;2012年09期
2 石轲;陈小平;;行动驱动的马尔可夫决策过程及在RoboCup中的应用[J];小型微型计算机系统;2011年03期
3 周文杰;徐勇;;基于CMA-ES算法的支持向量机模型选择[J];计算机仿真;2010年04期
4 齐心跃;田彦涛;杨茂;杨永明;;基于市场机制的多机器人救火任务分配策略[J];吉林大学学报(信息科学版);2009年05期
5 汪连贺,董江;Delaunay三角剖分的快速实现[J];海洋测绘;2005年03期
6 邵春丽,胡鹏,黄承义,彭琪;DELAUNAY三角网的算法详述及其应用发展前景[J];测绘科学;2004年06期
7 余丽琼,周振宇,郭绍忠,郭金庚;Condor系统在大吞吐量计算中的应用[J];信息工程大学学报;2004年01期
8 刘少华,程朋根,赵宝贵;约束数据域的Delaunay三角剖分算法研究及应用[J];计算机应用研究;2004年03期
中国硕士学位论文全文数据库 前3条
1 刘娟;RoboCup3D仿真中双足机器人的运动规划与协作机制[D];南京邮电大学;2014年
2 傅桂霞;基于AUV测量信息的时空3D数据地形构建[D];哈尔滨工程大学;2011年
3 石轲;基于马尔可夫决策过程理论的Agent决策问题研究[D];中国科学技术大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 董伯云;;基于篮球比赛协作战术的多采摘机器人联合作业系统[J];农机化研究;2018年07期
2 高亮;李玉;林文杰;赵泉华;;结合Delaunay三角网的图像分割[J];信号处理;2017年10期
3 侯晓琳;;三维地质界面曲面建模关键算法[J];科学技术与工程;2017年26期
4 刘佳;;基于网优大数据平台的LTE站间距算法研究[J];移动通信;2017年15期
5 何曼芸;程英蕾;聂玉泽;王琳;;综合不规则三角网和区域生长的建筑物提取方法[J];空军工程大学学报(自然科学版);2017年03期
6 范亚浩;吴晟;张长胜;李英娜;李川;;改进约束D-TIN的等高线陡坡区域识别[J];测绘科学;2017年11期
7 李沛鸿;祝宏宇;;复杂地形条件的地表面积计算软件开发[J];测绘科学;2017年11期
8 隋振;于文成;田彦涛;徐名源;;基于线性倒立摆模型的双足机器人步态规划[J];吉林大学学报(信息科学版);2017年02期
9 王晓庆;;基于VC++的约束TIN算法设计与实现[J];矿山测量;2017年01期
10 夏国芳;汤羽扬;;真三维重建技术在杭州灵隐寺石塔和经幢精细测绘中的应用[J];古建园林技术;2016年04期
中国硕士学位论文全文数据库 前10条
1 柴伟凡;仿真足球机器人防守动作及跑位研究[D];南京邮电大学;2017年
2 冯欢欢;基于机器学习的3D仿真足球机器人动作与协作优化[D];南京邮电大学;2017年
3 陈明杰;基于电能质量态势感知的分布式电源主动运行决策方法[D];湘潭大学;2017年
4 吴慧;人员能力与任务不确定环境下的一种任务分配方法研究[D];北京交通大学;2017年
5 徐晓星;2D仿真足球机器人系统的阵型与传球配合[D];南京邮电大学;2016年
6 刘健;面向实时业务QoS保障的IEEE 802.15.4优化及性能分析[D];吉林大学;2016年
7 金文文;基于球员协作关系的RoboCup仿真2D阵型学习[D];安徽工业大学;2015年
8 孙清;基于强化学习的多智能体协同机制研究[D];浙江工业大学;2015年
9 沈天跃;人工鱼礁投放误差评价方法研究[D];上海海洋大学;2015年
10 杨淳;基于BP神经网络的AUV航迹预测方法研究[D];哈尔滨工程大学;2014年
【二级参考文献】
中国期刊全文数据库 前10条
1 范长杰;陈小平;;实时动态规划的最优行动判据及算法改进[J];软件学报;2008年11期
2 杨洁;郑宁;刘董;罗时贵;;基于遗传算法的SVM带权特征和模型参数优化[J];计算机仿真;2008年09期
3 龙涛;沈林成;朱华勇;牛轶峰;;面向协同任务的多UCAV分布式任务分配与协调技术[J];自动化学报;2007年07期
4 黄宛宁;龚建伟;王鹏辉;;基于改进遗传算法的多机器人任务分配方法[J];计算机仿真;2006年11期
5 柳林;季秀才;郑志强;;基于市场法及能力分类的多机器人任务分配方法[J];机器人;2006年03期
6 胡晶晶;曹元大;胡军;;基于英式拍卖协商协议的多智能体任务分配[J];计算机集成制造系统;2006年05期
7 张驰,韩光胜;改进的模糊Q学习方法及其在RoboCup中的应用[J];计算机仿真;2005年05期
8 栾晓岩;一种TIN生成算法及其三维显示[J];海洋测绘;2004年05期
9 刘云江,韩光胜;基于多智能体规划的机器人足球决策模型[J];哈尔滨工业大学学报;2004年07期
10 吴丽娟;基于机器人足球比赛的进攻策略的实现[J];微计算机应用;2002年06期
中国硕士学位论文全文数据库 前10条
1 李源;基于三角网的DEM数据生成及可视化研究[D];中南大学;2009年
2 王艺寰;基于三维空间数据模型的AUV前视声呐视域探测仿真研究[D];哈尔滨工程大学;2009年
3 刘惠媛;三维海底地形绘制方法研究与实现[D];哈尔滨工程大学;2009年
4 夏少芳;基于不规则三角网的数字地形生成与简化算法研究[D];太原科技大学;2008年
5 宋秋艳;不规则三角网及其可视化实现[D];中南大学;2008年
6 史胜伟;真实感三维地形绘制与实时漫游[D];西安电子科技大学;2008年
7 宋玲玲;多波束测量数据预处理研究[D];南京航空航天大学;2007年
8 曲林;基于OpenGL的三维虚拟地形构建研究[D];东北林业大学;2007年
9 刘飒;基于OpenGL的三维地形可视化技术研究[D];大庆石油学院;2007年
10 贺全兵;地形三维可视化技术研究与实现[D];西南石油大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 宗光华;毕树生;王巍;李大寨;;机器人技术开拓未来——2005年国际机器人展(日本)巡礼[J];机器人技术与应用;2006年01期
2 陈林;奚如如;王兴松;;套索驱动细长机器人的初步设计与试验[J];机电工程;2011年03期
3 谢芝馨;;苏联机器人技术述评[J];机械与电子;1989年04期
4 罗飞,余达太;主动式控制──机器人抑振控制的有效方式[J];机器人;1995年04期
5 卢桂章;当前高技术发展的前沿——机器人技术[J];天津科技;1995年01期
6 苏陆;日本机器人技术与产品[J];全球科技经济瞭望;1995年01期
7 郁英霞;足球机器人没有“恐韩症”[J];计算机周刊;2001年35期
8 张小川,李祖枢,张品红,肖朝辉;基于行为的足球机器人动作规划[J];哈尔滨工业大学学报;2003年09期
9 佟海军,张广文,程福,刘中华;双轮驱动足球机器人加速性能的研究[J];机械与电子;2004年10期
10 王金鹏;赵昕;张淑芳;;虚拟足球机器人的动作决策与仿真[J];大连轻工业学院学报;2007年01期
中国重要会议论文全文数据库 前10条
1 刘任平;孙增圻;杨涛;;足球机器人设计与实现[A];2001年中国智能自动化会议论文集(上册)[C];2001年
2 王相东;;足球机器人制作[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
3 薛方正;;进化的足球机器人策略[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
4 熊磊;黄伟伟;李忠义;刘志东;;中型足球机器人踢球器机电一体最简化设计[A];2005中国机器人大赛论文集[C];2005年
5 佟国峰;何洪生;邵振洲;;基于Microsoft Robotics Studio的新型足球机器人3D仿真平台[A];2007年足球机器人大会论文集[C];2007年
6 丁希仑;徐坤;;一种新型变结构轮腿式机器人的设计与分析[A];2009年中国智能自动化会议论文集(第六分册)[中南大学学报(增刊)][C];2009年
7 宋彦恒;徐为民;贺锋;;足球机器人的动力学模型简化及应用[A];2005中国机器人大赛论文集[C];2005年
8 陆艳;马姗姗;王晓荣;张印强;;中型足球机器人的目标定位设计[A];2007年足球机器人大会论文集[C];2007年
9 李东亮;王海花;;足球机器人决策系统模型研究[A];经济策论(上)[C];2011年
10 黄海林;李兵;刘荣强;邓宗全;;空间运动度可重构机器人概念原理与应用[A];中国宇航学会深空探测技术专业委员会第七届学术年会论文集[C];2010年
中国重要报纸全文数据库 前10条
1 本报记者 王小伟;上市公司开演“机器人总动员”[N];中国证券报;2014年
2 记者 彭仲 通讯员 胡沛 徐文婷;中国机器人将装汉产“关节”[N];长江日报;2014年
3 王巍;政府采购提供完美“选秀方案”[N];政府采购信息报;2007年
4 巴黎高科评论 冯素雯 译;更好或更坏的“外科医生”?[N];经济观察报;2014年
5 刘培香;我国首个双足足球机器人问世[N];中国航天报;2004年
6 本版编辑 本报记者 杨猛 本报实习记者 冯雪 编译 本报记者 马佳;阵型能否决定比赛胜负[N];北京科技报;2006年
7 金志扬;球员能力是体现战术和阵型的根本[N];中国体育报;2006年
8 刘立;足球阵型的管理效应[N];中国石油报;2008年
9 海通期货 马慧芬;打造期货交易的攻防阵型[N];期货日报;2014年
10 本报记者 魏静;万亿市场推动机器人产业大爆发[N];中国证券报;2013年
中国博士学位论文全文数据库 前10条
1 孟健;复杂地形环境四足机器人运动控制方法研究与实现[D];山东大学;2015年
2 杨柯;水下自重构机器人游走仿生混合运动研究[D];上海交通大学;2014年
3 李健;安全中医按摩机器人臂系统与控制策略研究[D];北京理工大学;2015年
4 张宗郁;薄壁铝合金导管数字化装配及焊接偏差主动补偿[D];哈尔滨工业大学;2015年
5 李兴东;基于TOF相机的四足机器人地形感知及静步态规划研究[D];哈尔滨工业大学;2015年
6 那奇;四足机器人运动控制技术研究与实现[D];北京理工大学;2015年
7 叶溯;机器人光电视觉控制理论及其应用研究[D];电子科技大学;2015年
8 蔡润斌;四足机器人运动规划及协调控制[D];国防科学技术大学;2013年
9 王三秀;多关节机器人鲁棒跟踪控制策略研究[D];浙江工业大学;2015年
10 董悫;机器人宇航员空间攀爬运动与力柔顺装配控制[D];北京理工大学;2015年
中国硕士学位论文全文数据库 前10条
1 冯欢欢;基于机器学习的3D仿真足球机器人动作与协作优化[D];南京邮电大学;2017年
2 戴文静;自组织理论视域下机器人的“代差”及演化机制[D];哈尔滨工业大学;2012年
3 李泽玲;基于手势的机器人自然人机交互系统[D];华南理工大学;2015年
4 贾学超;腿式机器人分布式控制系统与运动优化[D];浙江大学;2015年
5 卢衷正;基于虚拟样机技术的四足除草机器人结构设计和仿真[D];昆明理工大学;2015年
6 陈家顺;基于人机交互的机器人动作模仿学习[D];华南理工大学;2015年
7 马丹妮;七自由度机器人轨迹规划问题研究[D];上海师范大学;2015年
8 陈亮;六自由度机器人在骨科手术中的应用研究[D];长安大学;2015年
9 柏雪峰;一种双摄像头协同的机器人机械手物体抓取方法实现[D];西南交通大学;2015年
10 殷盛江;六自由度串联关节机器人惯性及摩擦参数辨识仿真[D];山东建筑大学;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026