收藏本站
《清华大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

群体Agent合作求解方法的研究

张双民  
【摘要】:群体Agent合作是多Agent系统(MAS)研究的重要问题之一,也是MAS问题的一种有效的求解方式。针对群体Agent合作求解研究工作中存在的问题,本文主要研究了群体Agent合作求解模型、合作求解方法以及合作策略评估等问题。包括: (1)给出一种基于模态算子的群体Agent合作求解逻辑模型 将群体Agent的BDI思维属性模型与外部环境状态相结合,给出MAS语言语法、语义模型和相关的定义和公理;按照有能力做、适合做和可以做三种不同的能力表现形式,对Agent能力进行分层描述,利用模态算子重新定义合作求解过程,并给出有关任务分解分配过程的描述,部分改进了Koller等人的工作。 (2)给出群体Agent合作求解策略的表示与评估 利用影响图建立群体Agent合作求解模型;运用基于情景演算的并发程序语言—ConGolog描述群体Agent联合策略;同时以ConGolog的结构化操作语义为依据,给出联合策略的评估算法;并证明在自然反馈互异的求解模型中,评估算法仍然能够正确评价不同的联合策略。 (3)给出一种基于角色跟踪的再励学习方法 将单Agent再励学习推广为群体Agent再励学习,在学习模型中引入角色属性,提出一种基于角色跟踪的群体Agent再励学习算法,研究算法的理性和收敛性,并进行了实验分析,部分改进了Bowling和Littman等人的工作。 (4)给出一种基于特征向量提取的可分解马尔可夫决策过程模型的方法 针对可分解马尔可夫过程模型的特点,通过提取状态特征向量近似状态效用函数,从线性规划和再励学习两种求解角度分别进行约束不等式组的化简和状态效用函数的高维移植,并以机器人足球赛任意球战术配合为背景验证基于特征向量的再励学习算法的有效性和学习结果的可移植性,部分改进了Gestrin等人的工作。
【学位授予单位】:清华大学
【学位级别】:博士
【学位授予年份】:2004
【分类号】:TP393.09

【相似文献】
中国期刊全文数据库 前10条
1 杨建卫;;基于多Agent的金融生态评价模型[J];信息技术;2011年06期
2 贾书军;张瑞生;贺莹;;基于多Agent的远程教学系统研究[J];甘肃科技;2011年13期
3 林芳;;基于AGENT技术的网络协作学习研究[J];煤炭技术;2011年07期
4 李佩顺;;探讨入侵检测系统在信息安全中的应用[J];农业网络信息;2011年08期
5 刘康;余腊生;;基于多Agent的群体状态预测策略研究[J];软件导刊;2011年08期
6 马荣飞;赵效萍;;基于Agent的智能教学系统的研究[J];赤峰学院学报(科学教育版);2011年04期
7 李军虎;;一种基于多Agent远程分布式故障诊断系统模型[J];计算机与数字工程;2011年06期
8 郭奥托;高雅田;;大型数据库操作中KQML行为原语集的扩充[J];价值工程;2011年23期
9 汪益民;杨春节;;一种校内网资源搜索引擎的设计与实现[J];微型机与应用;2011年15期
10 黄付亮;张荣国;陈大川;刘焜;;基于联合博弈的多Agent学习[J];计算机与数字工程;2011年06期
中国重要会议论文全文数据库 前10条
1 ;A Note on Two-agent Single-machine Scheduling Problem with Deteriorating Jobs[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
2 盛惠强;;基于内容和移动Agent的网络计费系统的设计[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
3 杨海明;程龙;赵佛晓;徐娟;;基于分布式Agent的网格任务调度模型研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
4 颜宇甲;程国建;毛书君;;基于多Agent系统的生态系统建模和仿真[A];第十二届中国青年信息与管理学者大会论文集[C];2010年
5 李志凌;焦丽萍;;一种改进型Agent体系结构研究[A];第七届中国通信学会学术年会论文集[C];2010年
6 郭瑞鹏;王永军;董平;;基于Agent分布式国民经济动员决策支持系统研究[A];Well-off Society Strategies and Systems Engineering--Proceedings of the 13th Annual Conference of System Engineering Society of China[C];2004年
7 陈红英;;基于Agent的GIS服务共享系统的研究[A];第二十七届中国控制会议论文集[C];2008年
8 ;Coordinated Control of Second-Order Multi-Agent Systems With Quantized-Observer[A];中国自动化学会控制理论专业委员会D卷[C];2011年
9 高春蓉;贲可荣;;基于Agent的行为模型在通信对抗仿真中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
10 赫连佳鹏;景旭;张影;;Agent-Based的神经网络仿真设计在经济系统中的应用[A];'2002系统仿真技术及其应用学术论文集(第四卷)[C];2002年
中国重要报纸全文数据库 前10条
1 Hotsky;昨日重现[N];中国电脑教育报;2003年
2 王宏;从我为网活 到网为我用[N];中国计算机报;2003年
3 河北 周建军;用Agent步入新闻组[N];电脑报;2001年
4 湖南 何锋;高级系统代理Advanced System Agent[N];电脑报;2001年
5 ;无需等待的自防御系统[N];中国计算机报;2004年
6 熊智宏 刘永纯;AIA大厦 何以重振昔日雄风[N];中国邮政报;2000年
7 饶慧敏;天下互联将入全球市场[N];中国国门时报;2004年
8 逍遥浪子;为网页添加动画精灵[N];电脑报;2003年
9 张维明 邓苏 肖卫东 汤大权;应对信息爆炸的挑战[N];计算机世界;2001年
10 康祥顺;给网页添彩[N];中国电脑教育报;2003年
中国博士学位论文全文数据库 前10条
1 焦俊;基于多Agent系统的智能车辆自主行驶控制研究[D];合肥工业大学;2010年
2 贺利坚;多Agent系统中信任和信誉模型的研究[D];北京交通大学;2011年
3 张双民;群体Agent合作求解方法的研究[D];清华大学;2004年
4 高嘉爽;基于Agent及FEA的焊接加工过程协同设计系统研究[D];哈尔滨工业大学;2009年
5 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2009年
6 赵欣培;一种基于Agent的软件过程建模方法研究[D];中国科学院研究生院(软件研究所);2005年
7 王文玺;基于多Agent系统的自主式地面车辆关键技术研究[D];西南交通大学;2010年
8 施亚能;基于多Agent食品安全政府监管模型与仿真[D];武汉理工大学;2011年
9 史旭华;基于多Agent系统的人工免疫网络及其应用研究[D];华东理工大学;2011年
10 黄红兵;基于涌现视角的多Agent系统分析研究[D];国防科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 胡涛;基于多Agent的海洋数据采集与传输系统的研究[D];东华大学;2010年
2 顾陈琳;基于信任度模型的多Agent全局协调[D];南京航空航天大学;2010年
3 刘阳;系统集成中基于联邦的Agent包装模型的研究与实现[D];西安电子科技大学;2010年
4 吴雪峰;基于Agent的易视监控审计系统设计及应用[D];南京理工大学;2010年
5 谢作坤;基于多Agent的车载信息管理系统[D];浙江工商大学;2010年
6 赵晨光;面向系统集成的一种主动感知Agent模型[D];西安电子科技大学;2009年
7 吕桃霞;基于Agent技术的网络安全审计模型研究与实现[D];山东师范大学;2011年
8 韩珍;驾驶员—车辆Agent微观换道行为的建模[D];中国科学技术大学;2011年
9 洪梅;基于Agent的对等分布式协同入侵检测技术的研究[D];山东大学;2010年
10 莫勇权;多Agent在网络管理中的应用研究[D];兰州大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026