六子棋博弈中搜索技术的研究与实现
【摘要】:计算机博弈是人工智能重要的组成部分,本质是让计算机模仿人的思维下棋,甚至超越人的智力,体现它的智能化,例如谷歌开发的AlphaGo。对计算机博弈的研究,不仅促进了博弈论的发展,也对人工智能产生深远影响。本文在六子棋项目基础之上,对六子棋所使用到的搜索技术进行相关分析和优化,主要有三个方面:博弈策略,算法和评估函数。对于博弈策略方面,采用了反迫著的搜索方法,用于模拟己方防御。对于博弈算法方面,使用了基于“路”局部扫描和基于“棋型”全局扫描的组合,并将这种方法应用到Alpha-Beta算法中。在评估函数中,设计了基于“路”和基于“棋型”两种评估函数,并使用自适应遗传算法对基于“棋型”的评估参数进行离线自学习。本文的主要工作和特色如下:(1)基于“迫著”设计了“反迫著”搜索方法,应用于搜索最佳落子点方法中VCF(连续迫著)之后Alpha-Beta搜索之前,通过模拟预测对方是否存在能够通过连续迫著获胜的走法来作为己方防守的参考,作为Alpha-Beta防守的一部分,提高总体防守的准确性。通过实验对比可得:相对于未使用反迫著方法,加入反迫著防守搜索技术后,在反迫著成功的情况下可以明显提高防守阶段的搜索效率和博弈水平。(2)采用局部搜索“路”和“棋型”的组合搜索棋盘的方法,并结合到Alpha-Beta中。采用基于“路”局部扫描对扩展的节点进行评估,充分利用路扫描的简单快速性特点,提高估值效率;采用基于“棋型”局部扫描方式对叶子节点进行估值,并将基于“棋型”局部扫描改为全局扫描,保证叶子节点估值准确性。通过实验对比可得:相对于基于“路”局部单一搜索或基于“棋型”局部单一搜索,基于“路”局部扫描和“棋型”全局扫描的组合搜索在保持搜索效率情况下可以提高博弈水平。(3)使用自适应遗传算法对基于“棋型”的评估函数参数进行了遗传训练,局面估值参数的调整遵循进化规则和博弈经验,让估值参数的调整更合理,使估值参数更适合于复杂局面的变化情况,提高局面估值准确性。通过实验可得:相对于未优化的棋型价值参数,使用自适应遗传算法进化后的棋型价值参数可以提高博弈水平。以上所述方法(1)和(2)已应用于六子棋程序“出棋制胜”中,在比赛过程中得到相应的效果,取得一定的成绩,核心思路可作为其它棋种设计的基础。上述搜索技术(3)已经过实验证明,将应用于2016年计算机博弈大赛软件设计中,希望可以获得更好的成绩。
|
|
|
|
1 |
杨崇俊;刘冬林;张富庆;王刚;付理;杨洪志;田生军;李彬;张荟娟;王芙蓉;李津平;乐小虬;张建兵;宋子辉;;电子政务与隐形搜索技术——词虎[A];提高全民科学素质、建设创新型国家——2006中国科协年会论文集(下册)[C];2006年 |
2 |
谢力;;云时代的图片存储与搜索技术研究[A];四川省通信学会Ip应用与增值电信技术会议论文集[C];2011年 |
3 |
杨崇俊;刘冬林;张富庆;王刚;付理;杨洪志;田生军;李彬;张荟娟;王芙蓉;李津平;乐小虬;张建兵;宋子辉;;电子政务与隐形搜索技术-词虎[A];中国测绘学会2006年学术年会论文集[C];2006年 |
4 |
叶伟芳;;基于P2P的搜索技术和方法研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年 |
5 |
陆宇旻;杨柳;;JXTA CMS搜索技术的研究[A];广西计算机学会2004年学术年会论文集[C];2004年 |
6 |
李翔;梁昔明;阎纲;龙祖强;李庆华;;用协同线搜索技术改善PSO优化性能[A];第二十七届中国控制会议论文集[C];2008年 |
7 |
陆宇旻;杨柳;;JXTA CMS搜索技术的研究[A];广西计算机学会——2004年学术年会论文集[C];2004年 |
|