收藏本站
《哈尔滨工业大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

多智能体机器人系统中的若干通信技术研究

刘海涛  
【摘要】: 利用通信提高多智能体机器人系统协调控制的性能是近年来多机器人和多智能体领域中的研究热点之一。如何通过通信进行信息共享对于合作与协调至关重要,本文介绍了多智能体机器人系统的通信方式,对合作中通信方面当前关注的主要研究内容和方法进行了系统地总结和综述,对比和分析了近年来基于通信的分布式控制系统典型的建模方法。在此基础上,对基于通信的多智能体机器人系统协调控制中的若干关键问题进行了较深入的分析和研究。具体包括以下几方面研究内容: 建立了无偿通信情况下多智能体机器人系统协调控制的集中式模型。将通信代价参数化表示后引入模型,建立了无偿通信时团队协调的集中式控制模型,即无偿通信的存在可以将多智能体部分可观察马尔可夫决策过程(POMDP)简化为单智能体POMDP。为求解带有不确定性的POMDP近似最优策略,提出了一种新的方法,利用结合进化算法的强化学习来估计POMDP的最优解。利用Memetic算法来进化策略,而Q学习算法得到预测奖励来指出进化策略的适应度值。针对隐状态问题,通过记忆智能体最近经历的确定性的有限步历史信息,与表示所有可能状态上的概率分布的信度状态相结合,共同决策当前的最优策略。利用一种混合搜索方法来提高搜索效率,其中调整因子被用于保持种群的多样性,并且指导组合式交叉操作与变异操作。在POMDP典型实例问题上的实验结果证明本文提出的算法性能优于其他的POMDP近似算法。最后针对无偿通信时多智能体机器人系统协调问题进行了有效性实验。 无偿通信可以将多智能体POMDP的计算复杂度简化为单智能体POMDP的计算复杂度,然而实际应用中通信不是无偿的,常常期望减少多智能体机器人系统协调所需通信的数量。为此提出了一种新的分散式通信决策算法,利用有向无环图表示团队的可能联合信度,基于此以分散式的方式制定通信决策,仅当智能体自身的观察信息显示共享信息将导致期望回报升高时选择通信。通过维持以及推理团队的可能联合信度将集中式单智能体策略应用于分散式多智能体POMDP问题。通过实验以及一个详细的实例表明,利用我们提出的DAG_DEC_COMM分散式通信决策算法能够有效地减少通信资源的使用,同时提高分散执行的性能。 不可靠的通信是众多多智能体实际应用领域的基本特征。有限的带宽、干扰以及视线是通信失败的主要原因。本文在分布式约束优化问题框架下研究了改进的分布式约束推理算法,使其能有效地运行在不可靠的通信条件下。为了减少不必要的通信量,提高算法性能,改进了Adopt算法,使其在保证活性的前提下减少了搜索最优解所需通信消息的数目。此外,分析了引起消息丢失的原因,提出了兼顾两种原因引起的消息丢失的改进方法。结果显示改进后的Adopt算法在通信不可靠时也能保证终止于最优解,并且得到解的时间随着消息丢失概率的增加适度地降低了。 近年来多智能体联合作业受到显著关注。人、智能体混合团队得到了广泛应用。本文研究并设计实现了一种基于移动信息设备的多智能体人-机器人混合团队系统。首先提出了一种基于移动信息设备的多智能体人-机器人混合团队系统的体系结构,然后设计并实现了基于移动信息设备的人与机器人之间以及多机器人间的通信系统,实现了团队成员间的信息共享。最后利用实验来验证本文的方法,实验结果表明用户能在自然、便捷的方式下进行人-机器人交互,完成远程监控任务,多机器人通过通信将各个机器人的局部环境模型构建成团队环境模型,有利于提高团队协调工作的性能。
【学位授予单位】:哈尔滨工业大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:TP242.2

知网文化
【引证文献】
中国期刊全文数据库 前1条
1 经建峰;楼佩煌;;基于智能体的分布式多AGV控制系统设计与实现[J];工业控制计算机;2013年09期
中国博士学位论文全文数据库 前6条
1 杨斯博;基于自组织多Agent系统的智能控制与决策研究[D];天津大学;2012年
2 陈成;基于多Agent系统的供应链可靠性管理模型研究[D];南京理工大学;2011年
3 王文玺;基于多Agent系统的自主式地面车辆关键技术研究[D];西南交通大学;2010年
4 杨迎泽;重载组合列车同步制动系统故障诊断技术与应用研究[D];中南大学;2010年
5 杨立新;一类随机非线性系统控制设计算法及应用[D];哈尔滨工程大学;2012年
6 齐雪;自主水下机器人操纵运动的非线性控制方法研究[D];哈尔滨工程大学;2012年
中国硕士学位论文全文数据库 前3条
1 吴彬;RoboCup中型组机器人通信网络系统设计研究[D];长安大学;2011年
2 张勇;异构双腿机器人步态规划与控制研究[D];东北大学;2009年
3 陈韶飞;仿人机器人多控制器通信系统的研究[D];重庆大学;2010年
【参考文献】
中国期刊全文数据库 前9条
1 贺利坚;张伟;;基于约束图分片求解DCOP的Agent组织结构[J];计算机研究与发展;2007年03期
2 陈卫东,席裕庚,顾冬雷;自主机器人的强化学习研究进展[J];机器人;2001年04期
3 苏治宝,陆际联;多移动机器人队形控制的研究方法[J];机器人;2003年01期
4 洪炳熔,韩学东,孟伟;机器人足球比赛研究[J];机器人;2003年04期
5 赵杰;姜健;臧希喆;;基于强化学习的未知环境多机器人协作搜集[J];计算机工程与应用;2007年10期
6 高大启;有教师的线性基本函数前向三层神经网络结构研究[J];计算机学报;1998年01期
7 董红斌,王建华;多Agent技术研究[J];计算机应用研究;1999年10期
8 高阳,陈世福,陆鑫;强化学习研究综述[J];自动化学报;2004年01期
9 王秦辉;陈恩红;王煦法;;分布式约束满足问题研究及其进展[J];软件学报;2006年10期
【共引文献】
中国期刊全文数据库 前10条
1 马丽丽;贺超兴;纪建伟;张志斌;;基于BP神经网络番茄果实横纵径生长的建模研究[J];安徽农业科学;2008年06期
2 李大林;陈一帆;蔡润;;多性状群体信息熵混杂递增链与混杂指数的应用[J];安徽农业科学;2008年13期
3 张涛;;提高离散数学课程学习兴趣的教学改革探讨[J];安徽工业大学学报(社会科学版);2012年01期
4 杨广俊,战学刚;足球机器人视觉系统的目标识别策略[J];鞍山科技大学学报;2005年05期
5 张峰;王金超;陈雪波;;机器人队形控制中的二叉树方法[J];辽宁科技大学学报;2010年05期
6 张冬梅;刘强;;一种基于强化学习的传感器网络应用重构决策方法[J];北京交通大学学报;2010年03期
7 谷学强;陈璟;王克波;;面向目标区域规划的分布式约束满足求解方法[J];兵工自动化;2009年01期
8 柴仲明;禹梅;刘舒;;基于遗传算法的机器鱼路径规划[J];兵工自动化;2010年11期
9 杨博;王向华;邵利平;覃征;于维虎;;基于群集智能的传感器管理方法研究[J];兵工学报;2012年02期
10 高吉;;在ArcGIS矢量图中搜寻最短路径的实现[J];北京测绘;2009年02期
中国重要会议论文全文数据库 前10条
1 李娜;高广勇;何宏启;曹阳;;基于神经网络模型的室内空气品质评价方法研究[A];2011中国环境科学学会学术年会论文集(第四卷)[C];2011年
2 李东亮;王海花;;足球机器人决策系统模型研究[A];经济策论(上)[C];2011年
3 刘智勇;马凤伟;;城市交通信号的在线强化学习控制[A];第二十六届中国控制会议论文集[C];2007年
4 沈捷;王莉;林锦国;费树岷;;基于Leader-following方式的多移动机器人队形控制方法研究[A];第二十七届中国控制会议论文集[C];2008年
5 王红;周越;;移动机器人的分层式运动规划方法研究[A];第二十七届中国控制会议论文集[C];2008年
6 仲朝亮;刘士荣;吕强;;RobSim:一种多移动机器人仿真系统[A];第二十七届中国控制会议论文集[C];2008年
7 黎明;刘伟兵;王先甲;;基于神经网络与群智能的多代理人决策与行为演化[A];第二十七届中国控制会议论文集[C];2008年
8 ;A Constraint Satisfaction Algorithm for Fleet Weapon Compatibility[A];第二十九届中国控制会议论文集[C];2010年
9 付佳;王美玲;杨毅;周培德;;基于计算几何算法的多智能体快速编队[A];第二十九届中国控制会议论文集[C];2010年
10 朱琳;;声纳系统设计与调试中图论方法研究[A];2011'中国西部声学学术交流会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 张子迎;多机器人协作及环境建模技术研究[D];哈尔滨工程大学;2009年
2 王作为;具有认知能力的智能机器人行为学习方法研究[D];哈尔滨工程大学;2010年
3 陈得宇;基于MAS的智能电压控制系统研究[D];哈尔滨工程大学;2010年
4 赵丽宁;基于多AGENT的智能航运信息系统关键技术研究[D];大连海事大学;2010年
5 蒋国银;基于集成模拟的电子商务协同工作机制研究[D];华中科技大学;2010年
6 刘贵;精毛纺织品虚拟加工中的预报与反演模型研究[D];东华大学;2010年
7 林龙信;仿生水下机器人的增强学习控制方法研究[D];国防科学技术大学;2010年
8 薛颂东;面向目标搜索的群机器人协调控制及其仿真研究[D];兰州理工大学;2009年
9 夏益民;基于传感器信息融合的移动机器人定位与地图创建研究[D];广东工业大学;2011年
10 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 何慧娟;基于多传感器的移动机器人障碍物检测与定位研究[D];安徽工程大学;2010年
2 秦丰林;面向机器人足球比赛的开放式仿真系统开发[D];浙江理工大学;2010年
3 沈扬;协商僵局消解优化问题研究[D];郑州大学;2010年
4 张家飞;机器人群体协同任务规划与协调避碰[D];哈尔滨工程大学;2010年
5 杜峰;某型机器人的路径规划方法研究[D];哈尔滨工程大学;2010年
6 尹继超;机器人遥操作中关键技术的研究[D];哈尔滨工程大学;2010年
7 周雅琴;集群机器人无线网络时间同步与定位技术研究[D];哈尔滨工程大学;2010年
8 纪兴;基于行为的多机器人体系结构研究[D];哈尔滨工程大学;2010年
9 陈哲平;基于MSRS 5vs5仿真足球机器人决策系统的研究[D];长沙理工大学;2010年
10 王莉;半自主足球机器人中彩色图像对光照不变性研究[D];中国海洋大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 杨文建,李小平,李朝晖,邱睿;超细间距引线键合第一键合点工艺参数优化试验研究[J];半导体技术;2005年04期
2 广明安;韩雷;;超声键合过程中键合压力特性的实验研究[J];半导体技术;2006年08期
3 承向军,杨肇夏;基于多智能体技术的城市交通控制系统的探讨[J];北方交通大学学报;2002年05期
4 王婷;宋保维;;水下航行器多推进器动力定位控制[J];兵工学报;2006年05期
5 张飞舟;曹学军;孙敏;;基于多智能体的城市交通集成控制系统设计[J];北京大学学报(自然科学版);2008年02期
6 H.Kurz,刘信君;ICE3和ICE-T——德国铁路新一代动车组[J];变流技术与电力牵引;2001年01期
7 刘元洪;罗明;刘仲英;;供应链评价体系构架的研究[J];商业研究;2005年24期
8 刘元洪;罗明;;供应链成员企业可靠性评价指标体系研究[J];商业研究;2007年04期
9 吴希军;胡春海;;基于核主元分析与神经网络的传感器故障诊断新方法[J];传感技术学报;2006年01期
10 李舜酩;沈峘;毛建国;辛江慧;缪小东;;智能车辆发展及其关键技术研究现状[J];传感器与微系统;2009年01期
中国博士学位论文全文数据库 前10条
1 文敦伟;面向多智能体和神经网络的智能控制研究[D];中南大学;2001年
2 邓宏钟;基于多智能体的整体建模仿真方法及其应用研究[D];国防科学技术大学;2002年
3 李常洪;多Agent合作机制与合作结构研究[D];天津大学;2003年
4 钟碧良;机器人足球系统的研究与实现[D];广东工业大学;2003年
5 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
6 于江涛;多智能体模型、学习和协作研究与应用[D];浙江大学;2003年
7 王长缨;多agent协作团队的学习方法研究[D];国防科学技术大学;2004年
8 钟伟才;多智能体进化模型和算法研究[D];西安电子科技大学;2004年
9 刘静;协同进化算法及其应用研究[D];西安电子科技大学;2004年
10 刘淑华;复杂动态环境下多机器人的运动协调研究[D];吉林大学;2005年
中国硕士学位论文全文数据库 前10条
1 田新华;基于Simulink/Stateflow模型的成员开发环境的研究[D];国防科学技术大学;2002年
2 张凯;基于多智能体的机器人系统通信技术的研究[D];南京理工大学;2004年
3 冯云鹏;移动Agent系统通信机制研究[D];哈尔滨工程大学;2004年
4 邵黎君;基于CAN总线的仿人机器人关节控制系统研究[D];清华大学;2004年
5 付秀霞;现场总线协议的建模与仿真[D];北京化工大学;2005年
6 唐红卫;CAN总线实时性通信研究及改进[D];西安电子科技大学;2006年
7 李明波;基于CAN总线的实时通讯研究[D];北京化工大学;2006年
8 岳佳;基于EM算法的模型聚类的研究及应用[D];江南大学;2007年
9 谢建平;单处理器环境下实时混合任务的调度算法研究[D];武汉理工大学;2008年
10 高权;基于Simulink和Stateflow建模的嵌入式软件开发平台研究[D];电子科技大学;2008年
【二级引证文献】
中国硕士学位论文全文数据库 前10条
1 杨林蛟;英语语法在线学习系统的学生模型的研究与实现[D];沈阳师范大学;2011年
2 汪伟;重载组合列车管路泄漏诊断系统的研究与设计[D];中南大学;2011年
3 张喜会;机器人系统路径规划的研究[D];沈阳工业大学;2012年
4 张育中;异构双腿行走机器人步态模式研究[D];东北大学;2010年
5 董佳;CAN总线分析仪设计[D];华南理工大学;2012年
6 王晓丰;运动控制系统中基于CAN总线通讯的实时性研究[D];华中科技大学;2012年
7 刘成会;RoboCup中型组机器人全景视觉装置的设计研究[D];长安大学;2012年
8 周沙;基于Agent的高速公路收费站仿真系统设计[D];江西理工大学;2012年
9 李成林;基于e-puck机器人的多智能体实验平台的设计[D];哈尔滨工业大学;2013年
10 陈三元;基于重叠分解的重载组合列车管路泄漏分布式诊断研究[D];中南大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 陈光禹,李为民;一种基于神经网络的ICCAT专家系统测试方法的研究[J];电子学报;1994年08期
2 曹志强,张斌,谭民;基于行为的多移动机器人实时队形保持[J];高技术通讯;2001年10期
3 何小荣,陈丙珍,胡山鹰,朱振伟;一种新的BP神经网络培训方法[J];化工学报;1994年05期
4 高阳,周志华,何佳洲,陈世福;基于Markov对策的多Agent强化学习模型及算法研究[J];计算机研究与发展;2000年03期
5 李宁,高阳,陆鑫,陈世福;一种基于强化学习的学习Agent[J];计算机研究与发展;2001年09期
6 李建民,王建华,李毅,石纯一;多智能体系统的一种合作机制[J];计算机研究与发展;1998年02期
7 刘弘,曾广周,林宗楷;基于Agent的信息过程建模方法[J];计算机研究与发展;1998年08期
8 董胜龙,陈卫东,席裕庚;多移动机器人编队的分布式控制系统[J];机器人;2000年06期
9 孙吉贵 ,景沈艳;非二元约束满足问题求解[J];计算机学报;2003年12期
10 于建华;;人工神经网络在油气识别中的应用[J];模式识别与人工智能;1994年01期
【相似文献】
中国期刊全文数据库 前10条
1 陈胜军;面向工业机器人系统的可靠性预测方法研究[J];数学的实践与认识;2005年10期
2 张新予;匡以顺;;七自由度浮渣铲除机器人的运动学正逆解研究[J];装备制造技术;2007年01期
3 余月;王共先;;机器人经皮肾镜手术模拟演示系统的研制[J];现代泌尿外科杂志;2009年01期
4 ;中厚板焊接机器人系统(六)[J];现代焊接;2009年11期
5 ;昆山华恒机器人焊接系统应用(一)[J];现代焊接;2010年02期
6 杜祥民;张永寿;;达芬奇手术机器人系统介绍及应用进展[J];中国医学装备;2011年05期
7 周文华 ,赵雁南 ,王家钦;SERCOS总线及其在机器人系统中的应用[J];电子技术应用;2001年10期
8 白学普;;导管阀自动喷印机器人系统研究[J];国内外机电一体化技术;2001年02期
9 李浩,吴凯,陈武,黄龙杰;基于模糊控制的侦查机器人的设计[J];机电工程技术;2005年11期
10 刘相术;杨庆东;;基于VC的液下搅拌机器人控制软件的开发[J];北京机械工业学院学报;2006年01期
中国重要会议论文全文数据库 前10条
1 谢松钿;苏国岚;萧胜文;林冠良;;模组化机器人系统之设计[A];第二十七届中国控制会议论文集[C];2008年
2 徐琰;;分布式控制系统在排爆机器人中的应用[A];2010中国消防协会科学技术年会论文集[C];2010年
3 黄坤;曹利;曾孔庚;田心宽;耿国庆;;机器人在LF炉测温取样系统上的成功应用[A];中国计量协会冶金分会2011年会论文集[C];2011年
4 陈卫东;唐得志;王洪瑞;;基于模糊变结构的机器人自适应神经网络控制[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年
5 李丽霞;赵悦;宋烽;;Da Vinci S机器人系统对手术护理工作的挑战[A];全国第十一届手术室护理学术交流暨专题讲座会议论文汇编(上)[C];2007年
6 黄壮士;;机器人手术在微创食管外科的应用现状[A];中国第九届全国食管癌学术会议论文集[C];2009年
7 陈卫东;王海涛;王洪瑞;;基于模糊观测器的不确定机器人滑模变结构控制[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年
8 郭勇;;焊接机器人系统的应用[A];中西南十省区(市)焊接学会联合会第九届年会论文集[C];2006年
9 丁敏;唐新华;梅银玺;芦凤桂;姚舜;;一种八自由度窄间隙焊接机器人系统的设计与实现[A];第十五次全国焊接学术会议论文集[C];2010年
10 温淑焕;朱奇光;王洪瑞;;基于RBF神经网络的不确定机器人的自适应控制[A];第二十三届中国控制会议论文集(下册)[C];2004年
中国重要报纸全文数据库 前10条
1 薛严;韩选定10个新概念机器人研发项目[N];科技日报;2011年
2 本报记者 李响;唐山抓住机器人机会[N];计算机世界;2011年
3 邸力 陈建旭;唐山高新区机器人产业发展迅猛[N];中国高新技术产业导报;2011年
4 记者 桂运安;“机器人世界杯”科大摘金夺银[N];安徽日报;2011年
5 裴利云 田秋月 赵志远;高新区崛起机器人产业[N];唐山劳动日报;2011年
6 记者 张培发 曹斯 通讯员 郭业敏 邹莹;“广东造”智能手术机器人有望三年内进入临床试验[N];南方日报;2011年
7 邸力 陈建旭;抢占战略性新兴产业的前沿阵地[N];唐山劳动日报;2011年
8 记者 姜靖;我极地科考低空飞行机器人系统研制获突破[N];科技日报;2010年
9 柳莺;ODIM首次售出锚作机器人系统[N];中国船舶报;2008年
10 程刚;机器人“瑞德先生”问世[N];科技日报;2007年
中国博士学位论文全文数据库 前10条
1 张鹤;脊柱微创手术机器人系统(遥控型)及关键技术研究[D];第三军医大学;2012年
2 刘浩;导管机器人系统的建立及其关键技术研究[D];哈尔滨工业大学;2010年
3 魏娟;煤矿救援机器人系统运载车关键技术研究[D];西安科技大学;2011年
4 李岩;竞争型网络机器人系统关键问题研究[D];南开大学;2013年
5 冯美;腹腔微创手术机器人系统关键技术研究[D];哈尔滨工业大学;2012年
6 刘伟庭;软体蠕动机器人系统之研究[D];浙江大学;2006年
7 王惠娟;面向微创手术机器人系统的缝合打结行为研究[D];天津大学;2010年
8 张晓勇;机器人救援仿真系统中规划和自适应协作研究[D];中南大学;2010年
9 顾宝兴;智能移动式水果采摘机器人系统的研究[D];南京农业大学;2012年
10 张镇;面向迎宾机器人组件化系统的建模与控制研究[D];上海交通大学;2011年
中国硕士学位论文全文数据库 前10条
1 严霞;基于ZigBee无线传感网络的动物机器人系统MP3音频自嵌入方法研究[D];中国科学技术大学;2010年
2 苏鹏;仿生机械系统的无源动态运动综合[D];北方工业大学;2011年
3 朱琇琪;饰品研磨机器人系统的研究[D];上海交通大学;2011年
4 孙继武;基于多智能体机器人系统的实时通迅研究[D];南京理工大学;2002年
5 杨跃;基于ARM与Linux的排爆机器人系统设计[D];华南理工大学;2010年
6 赖锡煌;基于ADAMS虚拟平台的多关节机器人动力学分析[D];北方工业大学;2005年
7 许志峰;主从式远程操作机器人系统研究[D];东南大学;2004年
8 田晓华;基于LabVIEW的机器人声源定位系统设计[D];湖南大学;2010年
9 冯华山;基于Internet的远程控制机器人系统[D];西北工业大学;2004年
10 张凯;基于多智能体的机器人系统通信技术的研究[D];南京理工大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026