收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于马尔可夫决策过程理论的Agent决策问题研究

石轲  
【摘要】: 人工智能被认为其主要目标是构造可以决策出智能行为的Agents,即这些Agents能够在多方面再现人类可以做出的智能行为。马尔可夫决策过程(MDP)可以用来描述和处理大规模不确定性环境下的Agent决策问题。 RoboCup机器人世界杯是国际上一项为促进分布式人工智能、智能机器人技术及其相关领域的研究与发展而举行的大型比赛和学术活动,RoboCup仿真2D比赛是RoboCup所有项目中以Agent决策为重点的一个分支。 本文以马尔可夫决策过程的相关理论为基础,以RoboCup仿真2D比赛为实验平台,对Agent决策相关问题进行了研究。本文的主要工作可以概括为以下三个方面: 本文重构并实现了一个完整的RoboCup仿真2D球队决策系统WE2009。该系统以部分可观察随机博弈(POSG)的模型为理论基础,包括信息处理、高层决策和行为执行三个模块。特别是高层决策模块,采用基于独立行为生成器的结构设计,不仅可以充分利用Agent的决策时间,而且可以提高团队合作的效率。 本文提出了一类特殊的马尔可夫决策过程,即行动驱动的马尔可夫决策过程(ADMDP)。本文分析了ADMDP的理论模型,提出了ADMDP的相关求解方法。该方法采取离线值迭代与在线搜索相结合,在本文中用来求解RoboCup仿真2D比赛中的不离身带球问题,使Agent的带球性能有了较大的提高。 本文提出了一类特殊的马尔可夫博弈,即基于阵型的零和马尔可夫博弈(FZSMG)。本文分析了FZSMG的理论模型,并以此为基础来描述RoboCup仿真2D比赛中的Anti-Mark问题。针对Anti-Mark问题,本文提出了一个基于阵型变换的启发式求解方法,使球队在与盯人防守的对手比赛时取得了较好的效果。 本文的所有工作都是基于WE2009实现的,WE2009在完成后参加了2009RoboCup机器人世界杯和2009中国机器人大赛两次重要比赛,并且全部获得冠军。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张振文;程显毅;李明;;分布式强化学习在RoboCup中的应用[J];现代电子技术;2007年04期
2 姬朝阳;朱绍文;朱秋云;张琪;;一种基于对手行为预测的多智能体合作研究[J];计算机与现代化;2006年05期
3 徐怡,李龙澍;面向Agent的软件工程方法学[J];微机发展;2005年10期
4 赵曦滨,赵志峰,程显毅;RoboCup中基于动态目标驱动的抢断策略分析[J];计算机工程与应用;2003年22期
5 邱忠宇,王一欧,顾晃,吴昭同;基于多Agent的汽轮发电机组故障诊断系统[J];中国机械工程;2001年07期
6 张志良,楚丰,游大海,龙云;一种基于CORBA和Agent技术的电力市场仿真平台的研究[J];电力系统及其自动化学报;2002年04期
7 嵇海明,杨宗源,黄海涛;软件工程方法的新进展:面向Agent的软件工程[J];计算机应用研究;2003年05期
8 凌咏红;Agent迁移机制辨析[J];武汉理工大学学报;2003年06期
9 赵进,袁春风;移动Agent系统的安全性研究[J];计算机工程与设计;2004年04期
10 薛明志,钟伟才,刘静,焦李成;用于函数优化的正交Multi-Agent遗传算法[J];系统工程与电子技术;2004年09期
11 赵龙文,侯义斌;多Agent系统的组织结构与协同[J];计算机工程与应用;2000年10期
12 程显毅,董红斌;设计Agent系统应注意的问题[J];计算机工程与应用;2000年11期
13 优佳;管理你的UPS[J];市场与电脑;2000年09期
14 李一军,曹荣增,丁伟;基于Agent的智能电子商务支持系统研究[J];计算机工程与应用;2001年02期
15 楚丰,游大海;使用Agent技术的能量管理系统的研究[J];电力系统及其自动化学报;2001年05期
16 张建军,韩莹;Microsoft Agent技术在Delphi中的应用[J];电脑开发与应用;2001年04期
17 杨清,杨柳;网络信息发现系统中Multiagent的研究与设计[J];计算机工程与科学;2001年04期
18 谭长庚,王斌,王建新;基于Multi-Agent的Internet信息服务模式[J];计算机工程与应用;2002年12期
19 薛为民,石志国,谷学静,王志良;基于Agent的人机情感交互系统研究[J];计算机工程与应用;2002年19期
20 鄢琦,彭岩,齐剑锋,涂序彦;基于Agent结构的MIS系统设计及实现[J];计算机工程与应用;2002年23期
中国重要会议论文全文数据库 前10条
1 ;A Note on Two-agent Single-machine Scheduling Problem with Deteriorating Jobs[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
2 盛惠强;;基于内容和移动Agent的网络计费系统的设计[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
3 杨海明;程龙;赵佛晓;徐娟;;基于分布式Agent的网格任务调度模型研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
4 颜宇甲;程国建;毛书君;;基于多Agent系统的生态系统建模和仿真[A];第十二届中国青年信息与管理学者大会论文集[C];2010年
5 李志凌;焦丽萍;;一种改进型Agent体系结构研究[A];第七届中国通信学会学术年会论文集[C];2010年
6 郭瑞鹏;王永军;董平;;基于Agent分布式国民经济动员决策支持系统研究[A];Well-off Society Strategies and Systems Engineering--Proceedings of the 13th Annual Conference of System Engineering Society of China[C];2004年
7 陈红英;;基于Agent的GIS服务共享系统的研究[A];第二十七届中国控制会议论文集[C];2008年
8 ;Coordinated Control of Second-Order Multi-Agent Systems With Quantized-Observer[A];中国自动化学会控制理论专业委员会D卷[C];2011年
9 高春蓉;贲可荣;;基于Agent的行为模型在通信对抗仿真中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
10 赫连佳鹏;景旭;张影;;Agent-Based的神经网络仿真设计在经济系统中的应用[A];'2002系统仿真技术及其应用学术论文集(第四卷)[C];2002年
中国博士学位论文全文数据库 前10条
1 焦俊;基于多Agent系统的智能车辆自主行驶控制研究[D];合肥工业大学;2010年
2 贺利坚;多Agent系统中信任和信誉模型的研究[D];北京交通大学;2011年
3 高嘉爽;基于Agent及FEA的焊接加工过程协同设计系统研究[D];哈尔滨工业大学;2009年
4 赵欣培;一种基于Agent的软件过程建模方法研究[D];中国科学院研究生院(软件研究所);2005年
5 王文玺;基于多Agent系统的自主式地面车辆关键技术研究[D];西南交通大学;2010年
6 黄红兵;基于涌现视角的多Agent系统分析研究[D];国防科学技术大学;2009年
7 兰少华;多Agent技术及其应用研究[D];南京理工大学;2002年
8 赵剑冬;基于Agent的产业集群企业竞争模型与仿真研究[D];华南理工大学;2010年
9 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
10 马鑫;基于协同机制和智能算法的多代理系统研究及应用[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 石轲;基于马尔可夫决策过程理论的Agent决策问题研究[D];中国科学技术大学;2010年
2 胡涛;基于多Agent的海洋数据采集与传输系统的研究[D];东华大学;2010年
3 顾陈琳;基于信任度模型的多Agent全局协调[D];南京航空航天大学;2010年
4 吴雪峰;基于Agent的易视监控审计系统设计及应用[D];南京理工大学;2010年
5 谢作坤;基于多Agent的车载信息管理系统[D];浙江工商大学;2010年
6 吕桃霞;基于Agent技术的网络安全审计模型研究与实现[D];山东师范大学;2011年
7 韩珍;驾驶员—车辆Agent微观换道行为的建模[D];中国科学技术大学;2011年
8 洪梅;基于Agent的对等分布式协同入侵检测技术的研究[D];山东大学;2010年
9 莫勇权;多Agent在网络管理中的应用研究[D];兰州大学;2010年
10 明汉;基于移动Agent的分布式入侵检测系统研究[D];浙江师范大学;2011年
中国重要报纸全文数据库 前10条
1 Hotsky;昨日重现[N];中国电脑教育报;2003年
2 王宏;从我为网活 到网为我用[N];中国计算机报;2003年
3 河北 周建军;用Agent步入新闻组[N];电脑报;2001年
4 湖南 何锋;高级系统代理Advanced System Agent[N];电脑报;2001年
5 ;无需等待的自防御系统[N];中国计算机报;2004年
6 熊智宏 刘永纯;AIA大厦 何以重振昔日雄风[N];中国邮政报;2000年
7 梁涛;太原理工大学代表队摘金又夺银[N];太原日报;2008年
8 记者 钱怡;苏州两万学生玩机器人[N];苏州日报;2010年
9 本报记者 陈恒才 实习生 陈施雅;机器人能否变成真正的“人”?[N];中山日报;2008年
10 记者 谭华健;高新精尖电子产品尽展魅力[N];中山日报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978