收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

动态不确定性环境下的实时规划系统研究

李响  
【摘要】: 作为一种非常重要而且常见的智能行为和能力,规划(Planning)就成为人工智能研究的一个重要领域,很早就受到关注的主要问题之一。而在动态不确定性环境下的规划就因其更加贴近现实环境,具有更高的实用价值而成为目前规划问题研究的重点和热点。 本文首先分析动态不确定性环境的主要特点,包括: ■动态性:环境的状态无时无刻不在变化。它不仅仅受智能体自身的影响而变化,还受环境中其他智能体和其他因素的影响而变化。 ■智能体知识的局限性:一般来说,智能体不可能掌握环境中所有的知识,不可能了解可以引起环境变化的所有因素,不可能了解其他智能体的所有情况。智能体只可能部分的掌握这些知识,甚至对一些方面一无所知。 ■智能体行动的不确定性:智能体在环境中执行一定的行为,其结果是不确定的,事先无法对这个结果作准确的预测。 ■智能体观察的局部性:一般来说,智能体对环境的观察是不全面的。在同一时刻,智能体只能观察到环境中一部分的情况。 ■智能体观察的不确定性:智能体从环境中得到的观察一般来说是不准确的,有时甚至是错误的。 然后,对现有的规划系统在适应上述动态不确定性环境的能力进行了概述。分析了这些系统在适应动态不确定性环境方面各自的优点和不足。 本文的主要工作是基于以上的分析和认识,提出了基于PRS和决策论规划的面向动态不确定性环境的规划系统POMDPRS。并讨论了两种提高决策效率的改进方法。具体工作主要有: 1)提出了面向动态不确定性环境的规划系统POMDPRS。描述了其基本模型,并给出了形式化描述。POMDPRS通过保持PRS系统的持续规划机制来适应环境的动态性,通过使用环境状态空间上的概率分布作为智能体的信念来适应环境的不确定性,从而兼顾了两个大方面的要求。 2)阐述了状态因子化表示在POMDPRS中的应用,并给出了因子化的POMDPRS——FPOMDPRS的形式化描述。POMDPRS使用环境状态空间上的概率分布作为智能体的信念,并根据智能体输出的行为和接收到的观察来对其进行更新。但是在很多情况下,状态空间往往十分巨大,从而使得信念更新的时间消耗非常高,难以适应系统反应实时性的需要。因子化方法通过将状态表示中涉及到的环境属性根据其互相依赖关系来对它们进行划分。将一个状态表示为几个子状态的集合,从而将未因子化时的一个大状态空间变成几个较小的状态空间。从而信念也就变成几个子状态空间上的概率分布的集合。在信念更新的时候,对这几个子状态空间上的概率分布分别处理,从而达到削减信念分布时间消耗的作用。 3)阐述了Monte Carlo滤波表示在POMDPRS中的应用,并给出了应用MonteCarlo滤波的POMDPRS——MCPOMDPRS的形式化描述。削减信念更新的时间消耗的另一个方法是Monte Carlo滤波。它通过使用概率分布上有限的一些具体数值(样本)来代表整个分布,并根据行动和观察,使用SIR方法来对这个样本集进行更新。这使得信念更新的时间消耗依赖于样本集的大小。从而可以通过控制样本集的大小来控制信念更新的时间消耗。 因子化和Monte Carlo滤波可以在POMDPRS中结合起来使用。即先对状态进行因子化,然后再对一些仍然很大的子状态集使用Monte Carlo方法,从而达到进一步提高信念分布更新效率的目的。本文在最后具体描述了一个FPOMDPRS和MCPOMDPRS相结合的,在实体机器人上运行的机器人决策控制系统P-DOG并给出了实验结果,验证了POMDPRS及其变种的可行性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨军,万山虎,马晓岩,秦江敏;基于线性约束规划问题的神经网络模型[J];计算机工程;2003年04期
2 杨军,万山虎,马晓岩,秦江敏;一种线性约束规划问题的神经网络模型及其应用[J];计算机工程与应用;2002年14期
3 周波,何志均,庄越挺;GUIHUA:一种解决规划问题的工具[J];计算机研究与发展;1991年10期
4 吴兴远;莫小宝;李佳;;高级语言与lingo混合编程解决复杂规划问题[J];软件导刊;2009年01期
5 王世杰,刘国中,丁预展,金东兴,赵丽环,李五常;CAPP系统设计中的规划问题研究[J];计算机辅助工程;1996年02期
6 段红清;;用合并法求解日程规划问题[J];船海工程;1981年01期
7 吴忠,江滨;利用EXCEL工具求解规划问题[J];上海工程技术大学学报;1999年04期
8 ;关于第三代公众移动通信系统频率规划问题的通知[J];中国无线电管理;2002年11期
9 李泉永;对文献[1]宿舍单元规划问题的一点注记[J];桂林电子工业学院学报;1997年04期
10 梅辉;WCDMA系统中基站的功率规划问题[J];通信世界;2005年11期
11 丁德路;姜云飞;;智能规划及其应用的研究[J];计算机科学;2002年02期
12 梁伟晟;李磊;;基于情景演算的用户界面模型验证方法[J];计算机科学;2007年05期
13 廖乐健;许开全;曹元大;胡晶晶;;基于语义Web和约束满足技术的旅游规划系统[J];计算机科学;2005年09期
14 伍丽华;陈蔼洋;姜云飞;;规划问题编码为约束可满足问题的研究[J];计算机科学;2006年08期
15 刘志忠;贺毅辉;姜峰;;多本体环境下基于规划技术的自动服务组合[J];计算机工程;2011年02期
16 王世杰,刘国中,丁预展,金东兴,赵丽环,李五常;CAPP系统设计中的规划问题研究[J];CAD/CAM与制造业信息化;1996年03期
17 陈岁松;;用Excel求解规划问题[J];电脑界(应用文萃);2000年06期
18 赵喜清;刘守义;韩振芳;;用MATLAB解决规划问题的通用方法[J];河北北方学院学报(自然科学版);2010年01期
19 潘兆鸿;许超;雷海平;;化工企业排产规划问题的一种解法及其应用[J];化工自动化及仪表;1989年05期
20 梅辉;WCDMA系统中基站的功率规划问题[J];广东通信技术;2005年01期
中国重要会议论文全文数据库 前10条
1 杨印生;李树根;张魁元;张怀胜;;对称模糊规划问题的双水平截集解法[A];全国青年管理科学与系统科学论文集(第2卷)[C];1993年
2 黄河潮;林鹏;卢兆明;;p-中位数法在城市应急避难所规划中的应用[A];中国灾害防御协会——风险分析专业委员会第一届年会论文集[C];2004年
3 王忠诚;;试论土地利用总体规划与城市总体规划在建设发展中的协调统一问题[A];“土地利用总体规划与经济社会可持续发展”研究文集(上册)[C];2004年
4 匡萃冶;刘君玲;;公安人力资源战略与规划论析[A];区域人才开发的理论与实践——港澳台大陆人才论坛暨2008年中华人力资源研究会年会论文集[C];2008年
5 童万亨;陈国樑;;谈谈新农村建设的几个问题[A];社会主义新农村建设研究——中国农业经济学会2006年年会暨社会主义新农村建设学术研讨会论文集[C];2006年
6 周海滨;冷兆云;马博;杜正春;郎祖强;;配电网无功补偿点选择方法研究[A];中国高等学校电力系统及其自动化专业第二十四届学术年会论文集(上册)[C];2008年
7 刘敬生;周长银;;求解两阶段随机规划问题的近似水平方法[A];第十届中国青年信息与管理学者大会论文集[C];2008年
8 范斌方;;土地利用总体规划若干问题探讨[A];“土地利用总体规划与经济社会可持续发展”研究文集(上册)[C];2004年
9 陈楷;;模糊遗传算法在区域配网优化中的应用[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(上册)[C];2002年
10 介龙梅;徐丽;谷文祥;;基于启发式策略的时序图规划研究[A];2005年全国理论计算机科学学术年会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 李响;动态不确定性环境下的实时规划系统研究[D];中国科学技术大学;2004年
2 张长胜;求解规划、聚类和调度问题的混合粒子群算法研究[D];吉林大学;2009年
3 祖莉;智能割草机器人全区域覆盖运行的控制和动力学特性研究[D];南京理工大学;2005年
4 徐斌;产品分销网络多层规划模型及算法研究[D];南京航空航天大学;2008年
5 丁伟;市场机制下输电规划方法研究与投资分析[D];华北电力大学(北京);2007年
6 王辉;基于蚁群优化理论的家电产品拆卸规划方法研究[D];清华大学;2007年
7 闫庆辉;障碍环境下非完整轮式移动操作机运动规划方法研究[D];哈尔滨工业大学;2007年
8 李梅娟;自动化仓储系统优化方法的研究[D];大连理工大学;2008年
9 慈元卓;面向移动目标搜索的多星任务规划问题研究[D];国防科学技术大学;2008年
10 吴至友;全局优化的几种确定性方法[D];上海大学;2003年
中国硕士学位论文全文数据库 前10条
1 李英雄;模糊随机规划理论及其应用[D];哈尔滨工业大学;2006年
2 蔡德洪;铁路现代物流中心宏观布局规划问题研究[D];北京交通大学;2008年
3 刘青;物流中心城市的物流系统规划研究[D];中国石油大学;2007年
4 王悦;物流配送车队规划问题研究[D];大连海事大学;2003年
5 林瑞祥;研究生录取建模分析[D];南京航空航天大学;2005年
6 王君;一类广义拟可微函数研究及求解双层规划问题的KKT条件[D];大连理工大学;2006年
7 赵宇;基于规划的密码协议自动化验证技术研究[D];解放军信息工程大学;2007年
8 林洪伟;两类分式规划问题的算法研究[D];北方民族大学;2008年
9 郑光;多指灵巧手的操作规划研究[D];东南大学;2006年
10 杨龙宝;双层多随从规划的理论与算法[D];北京化工大学;2005年
中国重要报纸全文数据库 前10条
1 沈英甲;规划问题理性解决[N];科技日报;2004年
2 连俊;风景名胜区 规划问题多[N];经济日报;2002年
3 中国中医研究院中医药信息研究所 陈珞珈 李宗友 朱佳卿;区域卫生规划中中医医疗机构规划问题[N];中国中医药报;2001年
4 陈忠华;“俩老大”联手战煤荒[N];中国矿业报;2004年
5 徐鹃 戴春华;常州规划局:加强机制建设促效能提高[N];中国纪检监察报;2006年
6 记者 周祚 通讯员 章劲松;2010年广州市区将拥有9条城市轨道线[N];广州日报;2005年
7 刘超凡;以“一片两路”为突破口 尽快完善贵阳市城市和城市路网规划[N];贵州日报;2007年
8 本报记者 李传涛;HSDPA网络部署策略[N];通信产业报;2006年
9 记者 王大为;蔚小平等领导与王广辉一行座谈[N];锡林郭勒日报;2007年
10 文仕全;先“规划”之忧而忧[N];中国信息报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978