求解不确定马尔克夫决策问题
【摘要】:随机最短路径问题(SSPs)是不确定马尔可夫决策问题(MDPs)的一个子集,用价值迭代、策略迭代、RTDP、LAO*等算法可以有效处理SSPs。但在实际问题中,状态转移概率常常是不确定的,本文中我们采用闭区间来表示状态转移概率及状态对应的费用值,提出了一种求解随机最短路径问题的通用算法gLAO*,并证明了该算法的可采纳性定理;我们的方法具有很强的适应性,Buffet和Aberdeen的基于最坏模型求解方法只是它的一个特例。实验结果表明gLAO*很好地保持了LAO*的优化性能。
|
|
|
|
1 |
刘培德;;一种基于前景理论的不确定语言变量风险型多属性决策方法[J];控制与决策;2011年06期 |
2 |
杨东巍;谢福鼎;张永;;基于伽马分布的传感器网络信任反馈收集算法[J];计算机工程与设计;2011年09期 |
3 |
;[J];;年期 |
4 |
;[J];;年期 |
5 |
;[J];;年期 |
6 |
;[J];;年期 |
7 |
;[J];;年期 |
8 |
;[J];;年期 |
9 |
;[J];;年期 |
10 |
;[J];;年期 |
11 |
;[J];;年期 |
12 |
;[J];;年期 |
13 |
;[J];;年期 |
14 |
;[J];;年期 |
15 |
;[J];;年期 |
16 |
;[J];;年期 |
17 |
;[J];;年期 |
18 |
;[J];;年期 |
19 |
;[J];;年期 |
20 |
;[J];;年期 |
|