收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

幻影围棋非完美信息机器博弈问题关键算法研究

李洪业  
【摘要】:机器博弈是人工智能领域一个既古老又具有挑战的问题,为人工智能成果的验证提供了一个良好的平台。非完美信息博弈问题是机器博弈问题的一个重要的分支,由于这类博弈问题具有非完美信息,即参与者需要在只知道对手的部分信息的情况下做决策,因此,更接近现实世界中的决策问题,具有更高的研究价值。本文针对非完美信息博弈问题的关键算法进行了研究,尤其是具有大空间和高复杂度的非完美信息拓展型博弈问题,并在幻影围棋中对本文提出的算法的性能进行了分析,比较了不同算法的效果。本文以非完美信息拓展型博弈问题为基础和基本模型,给出了基于信念状态的非完美信息博弈问题的数学模型。在此模型的基础上,对非完美信息博弈问题的关键算法进行研究,提出了利用信念状态树的数据结构表示非完美信息博弈问题的博弈过程,以蒙特卡洛树搜索算法为基础,提出了信念状态-蒙特卡洛树搜索算法并应用于处理具有非完美信息的博弈决策问题。本文在信念状态-蒙特卡洛树搜索算法的基础上,提出了两种基于对手模型的信念学习算法,分别是在于部分偏执的信念学习算法和基于随机最优反应估计的信念学习算法,旨在利用非完美信息博弈问题的隐藏信息通过建立对手模型的使参与者获得更高的收益。之后,将信念状态-蒙特卡洛树搜索算法应用到幻影围棋博弈问题中,提出了幻影围棋博弈问题中信息的处理方法,并结合幻影围棋博弈问题的特点,给出了基于信念状态-蒙特卡洛树搜索算法在幻影围棋博弈问题中的改进算法进行了研究,提出了三种改进算法,包括混合策略、AMAF启发算法和信息探测。最后,在幻影围棋博弈问题下,对信念状态-蒙特卡洛树搜索算法的性能进行了分析,对两种信念学习算法的性能和效果进行了分析和对比,并且,对基于幻影围棋博弈问题的改建算法的效果进行了测试。


知网文化
【相似文献】
中国期刊全文数据库 前4条
1 张幸儿,潘征宇;面向目标的最佳α—β搜索策略及其在博弈问题中的应用[J];软件学报;1993年04期
2 倪志伟,贾瑞玉,程慧霞;解决一类博弈问题的神经网络系统[J];控制与决策;1996年02期
3 林厚从;;博弈问题的策略研究[J];软件导刊;2010年12期
4 ;[J];;年期
中国重要会议论文全文数据库 前2条
1 林元庆;陈加良;;关于博弈学习模型的研究[A];2001年中国管理科学学术会议论文集[C];2001年
2 李立清;;从经济学视角谈“绿色考场”制度构建问题[A];首届中国经济论坛论文集[C];2005年
中国博士学位论文全文数据库 前3条
1 穆蕊;非零和随机微分博弈及相关的高维倒向随机微分方程[D];山东大学;2015年
2 王昭;具有模糊支付的博弈问题及其应用研究[D];北京理工大学;2006年
3 谭德庆;多维博弈及应用研究[D];西南交通大学;2004年
中国硕士学位论文全文数据库 前10条
1 张芬;基于最优控制的微分博弈问题研究[D];云南师范大学;2015年
2 于洋;多目标博弈均衡解的算法研究[D];东北电力大学;2016年
3 李洪业;幻影围棋非完美信息机器博弈问题关键算法研究[D];东北大学;2014年
4 姜小华;偷税与反偷税,政府与企业税收博弈问题研究[D];浙江大学;2002年
5 范国强;若干排序博弈问题的协调机制研究[D];中国海洋大学;2014年
6 熊文耀;非零和随机微分投资组合博弈问题研究[D];中南大学;2013年
7 张春红;均值—方差及随机微分博弈问题研究[D];中南大学;2012年
8 诸栗;易逝品需求不确定的供应链主从博弈问题[D];天津大学;2007年
9 黄俏玲;零和随机微分投资组合博弈问题[D];中南大学;2013年
10 刘春丽;我国文献信息资源共享博弈问题研究[D];东北师范大学;2005年
中国重要报纸全文数据库 前3条
1 李方;汽车引发和谐思考[N];中国消费者报;2007年
2 杨柯;股市走牛 人才博弈问题显[N];人才市场报;2007年
3 北京科技大学教授 赵晓;化解过剩产能不能只依靠行政压缩[N];中国企业报;2014年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978