收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

机器人群体行为数学建模与定量分析方法研究

宋勇  
【摘要】:机器人群体行为是在机器人之间及机器人与环境之间的交互作用过程中涌现出来的,是一个高度复杂的动态的过程,其运动形式经常是混沌的。因此,现有的机器人行为建模与设计方法还不足以从机理上描述机器人群体行为的复杂性。机器人群体行为的科学分析方法就是要实现对机器人行为的数学建模与定量分析,这也是在实际机器人行为学习中亟待解决的关键理论和技术问题。 本文通过机器人任务建模及机器人与环境交互建模获得机器人行为相关参数的数学描述,并建立机器人群体行为混沌动力学模型,通过对数学模型的研究与分析有助于理解机器人行为系统内部的作用规律。机器人群体行为学习主要研究机器人之间及机器人与环境进行社会性交互的机制,在社会性交互作用中涌现出复杂的群体行为。本文通过对机器人群体行为的定量分析与数学建模,建立关于机器人、任务和环境之间的社会性交互的完整理论框架体系。具体研究内容为: (1)针对机器人在强化学习过程中存在的收敛速度慢、组合爆炸等问题,提出了一种基于神经网络的移动机器人路径规划强化学习初始化方法。神经网络与机器人工作空间具有相同的拓扑结构,每一个神经元对应于状态空间中的一个离散状态。首先根据已知的部分环境信息对神经网络进行演化,直到达到平衡状态,这时每个神经元的输出值就代表该状态可获得的最大累积回报。然后将当前状态执行选定的动作获得的立即回报加上后继状态遵循最优策略获得的最大折算累积回报(最大累积回报乘以折算因子),即可对所有状态-动作对的Q(5,a)设定合理的初始值。通过Q值初始化能够将先验知识融入到学习系统中,对机器人初始阶段的学习进行优化,从而为机器人提供一个较好的学习基础。 (2)针对机器人群体行为强化学习过程中算法收敛速度较慢的问题,提出了基于知识共享的顺序Q学习算法。在基于知识共享的顺序Q学习过程中,追捕机器人首先根据目标的运动状态利用聚类的方法形成不同的追捕团队,然后每一个团队内机器人按照一定顺序依次进行学习。每个机器人通过传感器获得当前环境状态,并判断其他机器人是否已经遇到过同样的环境状态,如果行为规则库中已经存在相同的状态,则根据知识库与行为规则库选择动作并对与其相对应的行为权重向量进行强化学习,否则,就将新的行为规则加入规则库。在对行为权重向量进行强化学习时,学习机器人利用加权策略共享为每个机器人分配相应的权值,并且利用所有机器人经验值的加权和来对行为权重进行强化学习。 (3)将前两部分研究内容实现的机器人行为作为建模对象,利用分形建模思想建立机器人协作追捕行为的完整数学模型。在对机器人行为进行建模的过程中,利用机器人协作追捕行为系统整体与局部具有的功能自相似性,从宏观向微观逐层细化地建立不同层次的机器人行为模型。首先根据具体任务确定系统总体目标;然后利用宏观建模法建立多机器人协作追捕行为状态层次的数学模型,分析个体参数对机器人群体行为的影响;最后利用多项式建模法建立机器人与环境交互作用的行为层次数学模型。通过对机器人群体行为进行建模,可以分析关键参数对系统行为的影响,通过数学分析获得系统的最优化参数选择,为机器人群体行为的设计与分析提供必要的理论依据。 (4)采用动力学系统理论分析机器人之间、机器人与环境之间的交互作用,利用系统中一个机器人的演化轨迹研究系统在多维相空间中的运动规律。首先采集一个机器人演化轨迹上不同时刻的数据点,选择适当的嵌入维与延迟时间,重构与原系统等价的相空间。相空间中的状态信息可以充分地描述多机器人系统,并且包含了对动力学系统进行状态预测所需的所有信息。然后分析相空间中吸引子的性质,计算吸引子的特征值,包括Lyapunov指数、关联维数、Kolmogorov熵等,根据吸引子的特征值对机器人群体行为进行定量地描述与分析。最后利用量化参数研究影响机器人交互作用的关键因素,加深对机器人交互作用机理的理解。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 黎萍;杨宜民;练家乐;;基于效用函数的多机器人系统任务分配[J];计算机应用研究;2009年02期
2 唐建中;杨公仆;阳含和;;多机器人系统的自动避免碰撞控制[J];西安交通大学学报;1988年06期
3 林怡青,郑时雄;机器人群体合作的信念分析[J];机器人;2000年05期
4 钱徽,吴春明,朱淼良;基于可重构体系的多机器人共享模块剩余能力估计[J];电子学报;2005年11期
5 孙鹏;陈小平;;RoboCup小型机器人仿真系统[J];计算机仿真;2006年04期
6 赵欣;;浅析多机器人技术及发展[J];装备制造技术;2009年05期
7 江金龙;张文栓;董通;陈国华;;多机器人半实物仿真系统的研究与实现[J];计算机仿真;2009年04期
8 邵杰;杨静宇;杜丽娟;;基于改进学习分类器的多机器人混合分层体系结构[J];南阳理工学院学报;2009年03期
9 林怡青;多机器人系统的干涉曲面和干涉区[J];机器人;1991年01期
10 洪炳熔,薄喜柱,王鸿鹏;基于多机器人的微机器人足球比赛系统[J];机器人技术与应用;1998年05期
11 丁滢颍;何衍;蒋静坪;;基于个性演化的多机器人自组织[J];模式识别与人工智能;2003年02期
12 姜健;赵杰;闫继宏;臧希喆;;基于排斥信息素的多机器人协作研究[J];计算机工程与应用;2007年22期
13 王娟;胡玉兰;;基于条件反馈机制Leader-follower多机器人队形控制[J];大众科技;2008年07期
14 王越超,谈大龙,黄闪,栾天,赵忆文;一个多智能体机器人协作装配系统[J];高技术通讯;1998年07期
15 张汝波,施洋;基于模糊Q学习的多机器人系统研究[J];哈尔滨工程大学学报;2005年04期
16 徐伟华;李迅波;;面向对象数据库在多机器人系统中的应用研究[J];电子技术应用;2006年12期
17 李玉坚;刘国栋;;一种基于蚁群算法的多机器人协作方法[J];江南大学学报(自然科学版);2007年02期
18 冯福生;赵振民;;多机器人队行控制的研究方法[J];煤炭技术;2008年06期
19 邵杰;杨静宇;;基于LCS的多机器人路径规划控制体系结构[J];微电子学与计算机;2010年11期
20 宋涛;机器人系统的操作能力与树型可重构的机器人研究[J];机器人;1996年05期
中国重要会议论文全文数据库 前10条
1 殷波;孟庆春;庄晓东;;基于模糊逻辑的多机器人系统智能学习方法[A];2005年中国智能自动化会议论文集[C];2005年
2 曹志强;王硕;张斌;谭民;;复杂未知环境下多移动机器人队形控制[A];钱学森科学贡献暨学术思想研讨会论文集[C];2001年
3 臧庆凯;李春贵;闫向磊;;基于MATLAB的PUMA560机器人运动仿真研究[A];广西计算机学会2010年学术年会论文集[C];2010年
4 张瑞强;霍伟;;多机器人夹持受限负载的自适应协调混合控制[A];1994中国控制与决策学术年会论文集[C];1994年
5 崔连虎;卢惠民;季秀才;郑志强;;RoboCup中型组多机器人协作机制研究[A];2007年足球机器人大会论文集[C];2007年
6 付佳;王美玲;杨毅;周培德;;基于计算几何算法的多智能体快速编队[A];第二十九届中国控制会议论文集[C];2010年
7 高建华;武传宇;李小明;;基于多机器人的协同物流作业系统设计及其仿真[A];系统仿真技术及其应用(第7卷)——'2005系统仿真技术及其应用学术交流会论文选编[C];2005年
8 刘满强;周红莉;;基于Internet的多机器人协作通信策略设计[A];第二十届中国(天津)’2006IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2006年
9 张镇;曹其新;张蕾;;基于CORBA的多机器人通信模型设计与实现[A];2007年中国智能自动化会议论文集[C];2007年
10 刘满强;周红莉;;基于Internet的多机器人协作通信策略设计[A];第二十届中国(天津)'2006IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 宋勇;机器人群体行为数学建模与定量分析方法研究[D];山东大学;2012年
2 雷艳敏;多机器人系统的动态路径规划方法研究[D];哈尔滨工程大学;2011年
3 李彦涛;助餐机器人样机研制及控制研究[D];哈尔滨工程大学;2012年
4 孙一兰;固体火箭发动机壳体内壁绝热层打磨机器人关键问题的研究[D];东北大学;2009年
5 张昊;大壁虎运动行为研究及仿壁虎机器人研制[D];南京航空航天大学;2010年
6 刘亚波;异构多机器人系统协同技术研究[D];浙江大学;2011年
7 王刚;仿蟹机器人步态规划及复杂地貌行走方法研究[D];哈尔滨工程大学;2011年
8 江励;双手爪式模块化仿生攀爬机器人的研究[D];华南理工大学;2012年
9 周巍;煤矿井下搜救探测机器人的路径规划及轨迹跟踪控制研究[D];太原理工大学;2011年
10 丁度坤;工业机器人智能运动控制方法的分析与研究[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 吴锋;多机器人系统路径规划方法研究[D];广东工业大学;2012年
2 朱彬;网络化多运动体协作控制系统的构建与实现[D];哈尔滨工业大学;2006年
3 钟贤坤;基于自由市场机制的多机器人探索仿真[D];北京交通大学;2007年
4 王凡;基于Agent的多机器人路径规划的研究[D];武汉理工大学;2006年
5 汪浩杰;多机器人系统中围捕策略的研究[D];华中科技大学;2007年
6 张莉莉;多机器人合作定位技术研究[D];中南大学;2009年
7 施文;多机器人通讯网络的路由协议的研究[D];南京理工大学;2005年
8 苏采兵;面向遥控焊接的多机器人系统关键技术研究[D];东北石油大学;2010年
9 冯睿;基于蚁群算法的多机器人协作机制研究[D];西北大学;2011年
10 申丽曼;室内环境下多机器人协作建图方法的研究[D];中南大学;2007年
中国重要报纸全文数据库 前4条
1 编译 王金元;蚂蚁机器人将会钻入人体内[N];北京科技报;2005年
2 善灵;清华一项目获教育部留学回国人员科研启动基金资助[N];科技日报;2007年
3 本报记者 李蕾 本报实习生 张敏 刘沁;八大菜系,机器人“管家”全精通[N];解放日报;2009年
4 石岩;智能敏捷家庭助理机器人综合平台[N];科技日报;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978