影响图的扩展及应用研究
【摘要】:
决策问题存在于生活的方方面面。由于客观事物的复杂性、不确定性以及人类思维的模糊性,对不确定环境下有效描述和求解决策问题的研究引起了人们极大的关注,成为不确定人工智能领域中的一个重要研究方向。
影响图是不确定环境中描述复杂决策问题的图模型,它表达了变量间的依赖关系、条件独立关系和决策者的偏好信息。使用影响图描述的决策问题,既能被计算机处理,也容易被不同层次的技术人员理解。影响图在决策问题的定性描述和定量说明之间搭建了桥梁。基于影响图,决策者在理解变量语义时冲突较小,不容易混淆,而且能够有效地进行决策分析和不确定性推理,找出能使自己获得最大期望效用的优化决策。由于影响图具有直观、表达信息量较多而模型规模较小的优点,在许多领域得到了广泛应用。然而,现实中的决策环境复杂多样,在一些应用中现有的影响图还不足以满足要求,因此有必要对它们进行扩展。论文主要研究影响图的扩展、学习及应用,目的是增强影响图对交互式决策、模糊事件和变量变量值不确定事件的表达能力,从而丰富和发展影响图的理论和技术,扩大影响图的应用范围。
本文的主要工作和创新之处总结如下:
(1)对影响图进行扩展。现有影响图只对单决策者的决策过程进行建模,影响图中的参数均为单值参数,因此当有多个决策者并且这些决策者相互影响彼此的决策及后果,或者决策涉及模糊事件和变量值不确定事件时,现有的影响图不能满足要求。论文对影响图进行了两种扩展:1)将策略博弈融入标准影响图,提出带有博弈元素的影响图(Influences Diagrams with Game elements,GIDs),使其能在交互式决策环境中建模多个决策者的决策过程,体现决策者之间的交互和影响。博弈论的应用将其他决策者所做的策略选择增加到影响每个理性决策者决策过程的因素中,从而使决策者在交互式决策环境中做出更加合理和理性的决策。博弈论与影响图的结合,使得GIDs在建模决策过程时既利用了影响图建模复杂决策问题的简明性和有效性,同时又利用了博弈论描述决策者之间交互的合理性;2)基于区间概率理论,扩展带有单值参数的影响图为带有区间参数的影响图(Influences Diagrams with Interval Parameters,IIDs)。IIDs使用区间参数表达决策者不确定的信念和偏好,这使决策者能够对涉及模糊事件和变量值不确定事件的决策过程进行建模,并且对决策者而言,指定区间参数要比指定精确的单值参数容易。
(2)提出带有博弈元素的影响图结构学习、带有区间参数的影响图结构学习、影响图序数效用学习的方法。使用影响图作为某一决策问题描述和求解的模型时,首先面临的问题就是影响图学习。影响图学习包括参数学习和结构学习两种情况。1)论文基于贝叶斯网结构学习的影响图结构学习方法,提出带有博弈元素的影响图和带有有区间参数的影响图的结构学习方法;2)论文提出了未知属性权重的博弈多属性决策模型,并用该模型学习影响图序数效用。该方法避免了为效用节点指定效用的困难,对影响图的学习有一定的帮助。
(3)提出带有博弈元素的影响图和带有区间参数的影响图的正向评价算法——应用带有博弈元素的影响图和带有区间参数的影响图寻找优化决策。影响图正向评价的目的是寻找能获得最大期望效用的优化决策,这是一项比较艰难的任务,因为在评价过程中涉及大量的概率计算,并且在影响图中常常包含多步决策,单步决策中的局部最优策略并不意味着在多步决策中最优。带有博弈元素的影响图和带有区间参数的影响图是两种扩展影响图,不能直接使用现有的评价方法进行评价,它们的评价存在更多的困难。因为评价GIDs时还需要考虑多个决策者间的博弈行为,评价IIDs时还需要计算大量的区间条件概率。由于遗传算法(Genetic Algorithms,GAs)具有全局搜索和操作简明的优点,论文提出了基于遗传算法的GIDs评价算法;对于IIDs,论文使用了类似于Cooper变换的方法,首先将带有区间参数的影响图转化为带有区间概率参数的贝叶斯网,然后基于贝叶斯网的推理完成影响图评价。论文通过实验验证了评价算法的评价结果及效率。实验结果表明:1)在交互式决策环境中,用带有博弈元素的影响图可以获得更加合理的决策;2)带有区间参数的影响图扩展了标准影响图的表达能力,标准影响图可以看作是带有区间参数的影响图的特例。
(4)提出影响图的反向评价方法——应用影响图推测竞争对手的私人信息。论文以影响图作为竞争对手的决策模型,以对手的目标是使整体决策的总期望效用最大为准则,将决策计算与贝叶斯网推理相结合,根据所观测到的竞争对手的决策行为,利用遗传算法推测对手的成本、资金、策略、效用等私人信息。实验结果表明,本文所提方法是可行的。
|
|
|
|
1 |
于睿箭,冯允成;影响图的基础理论和发展[J];北京航空航天大学学报;1994年04期 |
2 |
马春有;赵黎明;佘震宇;;基于影响图的区域水资源系统分析[J];水处理技术;2009年01期 |
3 |
周受钦,傅琼,谢友柏;分类决策影响图拓扑层的自动生成[J];系统工程理论方法应用;1999年02期 |
4 |
张红兵,赵杰煜,罗雪山;影响图的信息值分析[J];系统工程与电子技术;2004年04期 |
5 |
龚建朝;喻胜华;郭蕾;;局部影响分析中的一种新二阶方法[J];数学理论与应用;2007年02期 |
6 |
路梅;陈建斌;武刚;;基于概率影响图的IT项目风险评估方法研究[J];湖北农业科学;2010年02期 |
7 |
董志强,顾昌耀;贝叶斯决策的影响图分析方法[J];系统工程理论与实践;1994年11期 |
8 |
石晓军,任志安;项目投资风险分析方法研究:一种基于影响图的解析方法[J];系统工程理论与实践;2000年03期 |
9 |
汤勇;王玉玺;;林业项目投资风险分析方法研究——一种基于影响图的风险解析方法[J];绿色中国;2007年07期 |
10 |
吕栋雷;胡浩;;影响图建模算法的改进[J];火力与指挥控制;2008年10期 |
11 |
孔媛媛;王恒山;朱珂;李晟;;模糊影响图评价算法在供应链金融信用风险评估中的应用[J];数学的实践与认识;2010年21期 |
12 |
刘金兰,韩文秀,李光泉,陈国权;油气资源勘探项目风险分析[J];天津大学学报(自然科学与工程技术版);1997年05期 |
13 |
董志强,顾昌耀;线性回归模型的贝叶斯决策方法[J];北京航空航天大学学报;1994年03期 |
14 |
解锋昌,李勇;影响图在非线性回归异方差检验中的应用[J];南京林业大学学报(自然科学版);2005年04期 |
15 |
董志强,于睿箭,冯允成;条件独立性和影响图理论研究[J];系统工程理论方法应用;1994年03期 |
16 |
钟麟;陈丽娟;佟明安;张圣云;;基于影响图的多智能体学习算法[J];系统工程学报;2008年03期 |
17 |
刘金兰,韩文秀,李光泉;大型工程建设项目风险分析方法及应用[J];系统工程理论与实践;1996年08期 |
18 |
詹原瑞,何娟;树与影响图[J];系统工程理论与实践;1997年04期 |
19 |
董志强,顾昌耀,于睿箭;统计预测问题的决策影响图方法[J];系统工程学报;1994年01期 |
20 |
杨敏;褚恒之;;装备研制可靠性工作项目风险评估综合模型[J];项目管理技术;2009年07期 |
|