收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

围棋博弈机器学习算法的研究及应用

唐艳  
【摘要】:人工智能在现今社会中早已被充分运用至各个领域,如航天、军事、制造、商业、医学等等。而机器学习最初的研究目标则是让计算机系统具有人‘学习’的能力,以便实现人工智能。机器博弈作为研究人工智能的载体,有着如‘果蝇’在研究遗传基因时的良好优势。为此,机器博弈也被称为人工智能研究的‘果蝇’。围棋作为众多博弈游戏中的一种,有着复杂的状态空间。这直接意味着围棋机器博弈研究,亦有着相当的难度。将机器学习应用至围棋机器博弈中,让围棋博弈系统拥有自学习能力,以达到‘智能’的博弈。 本文将围棋机器博弈系统看作一个博弈智能体,该智能体利用已有的棋谱知识或称经验知识,通过不断地试探性下棋,从中获取可利用知识,寻找当下或几个步骤之内的最优步伐,以求胜利,并最终完成下棋。这个过程总的概括为一个‘搜索’过程,在这个搜索过程中,博弈智能体通过一定的方法对经验进行学习,最后获得可用知识,达成目标。文章主要分析了如下几个问题: 1.阐述博弈相关概念,机器博弈常用算法,以及围棋机器博弈的特点及关键技术;分析机器学习对智能的重要作用,以及在围棋机器博弈中应用机器学习算法的意义; 2.介绍机器学习在围棋机器博弈中的解决方法,包括蒙特卡洛思想、人工神经网络以及增强学习。其中,重点介绍了增强学习中时间差分算法的原理机制与应用。建立了基于时间差分算法的围棋机器博弈系统的模型,并运用至重理工‘骑士队’围棋机器博弈中; 3.量化围棋博弈动作,改进应用在围棋机器博弈中的时间差分算法,将经过时间差分算法学习后的棋盘状态值作为选取动作后所得的奖励之一,使博弈智能体获得更接近真实的棋盘信息。 4.采用围棋机器博弈平台实际对弈方式进行试验,不断进行对弈学习,逐步提高博弈能力;通过大量实验及训练,并比较算法应用前后、改进前后博弈智能体的博弈水平,验证采用时间差分算法与改进效果。部分研究成果参加了全国比赛,取得了不错的成绩,这些都表明了本文算法设计的有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 ;“第二届中国机器博弈锦标赛暨2007中国机器博弈学术研讨会”于2007年10月在重庆工学院隆重举行[J];重庆工学院学报(自然科学版);2007年12期
2 徐阳东;刘弘;;遗传算法在机器博弈中的创新应用[J];电脑知识与技术;2008年07期
3 徐长明;南晓斐;王骄;徐心和;;中国象棋机器博弈的时间自适应分配策略研究[J];智能系统学报;2006年02期
4 张小川;陈光年;张世强;孙可均;李祖枢;;六子棋博弈的评估函数[J];重庆理工大学学报(自然科学版);2010年02期
5 王赠凯;吕维先;;机器博弈搜索技术分析[J];软件导刊;2007年03期
6 杨军;张波;;机器博弈游戏在单片机上实现[J];计算机应用;2006年02期
7 张雪峰;连莲;徐心和;;基于有限自动机的“点点连格”机器博弈系统的建模与分析[J];沈阳建筑大学学报(自然科学版);2009年04期
8 徐长明;马宗民;徐心和;李新星;;面向机器博弈的即时差分学习研究[J];计算机科学;2010年08期
9 王书宇;李龙澍;汪群山;;改进的协同进化遗传算法在机器博弈中的应用[J];计算机技术与发展;2008年12期
10 徐长明;马宗民;徐心和;;一种新的连珠棋局面表示法及其在六子棋中的应用[J];东北大学学报(自然科学版);2009年04期
11 徐心和;邓志立;王骄;徐长明;刘纪红;马宗民;;机器博弈研究面临的各种挑战[J];智能系统学报;2008年04期
12 张振;庞海;;机器博弈及其搜索算法的研究[J];软件导刊;2008年07期
13 张振;顾治华;;机器博弈及其搜索算法的研究[J];电脑知识与技术;2008年24期
14 耿双;;中国象棋α-β中剪枝搜索算法的分析与改进[J];宁波大红鹰学院学报;2008年02期
15 张恩海;李彦平;朱俊威;;中国象棋多自动机复合模型及其估值方法研究[J];沈阳大学学报;2011年02期
16 曹慧芳;刘知青;;基于WinCE应用程序的围棋游戏开发[J];软件;2011年01期
17 林健;黄鸿;刘进长;;人工智能烽火点燃中国象棋——记“浪潮杯”首届中国象棋计算机博奕锦标赛暨2006中国机器博奕学术研讨会、“浪潮杯”首届中国象棋人机大战[J];机器人技术与应用;2006年05期
18 谷飙;;计算主义纲领与机器博弈的认知意蕴[J];南开学报(哲学社会科学版);2011年04期
19 王骐;孙建伶;;基于优化迭代的博弈树算法[J];计算机应用与软件;2008年02期
20 黄继平;张栋;苗华;;六子棋智能博弈系统的研究与实现[J];电脑知识与技术;2009年25期
中国重要会议论文全文数据库 前3条
1 朱峰;张雪峰;徐心和;;关于机器博弈中的逐步展开型对策的一点讨论[A];2007中国控制与决策学术年会论文集[C];2007年
2 徐心和;王浩;孔凡禹;;事件对策理论及在棋类游戏中的应用[A];2007年中国智能自动化会议论文集[C];2007年
3 徐心和;石鸿雁;;一个空战实例中的混合对策问题[A];2007中国控制与决策学术年会论文集[C];2007年
中国博士学位论文全文数据库 前1条
1 徐长明;基于连珠模式的六子棋机器博弈关键技术研究[D];东北大学;2010年
中国硕士学位论文全文数据库 前10条
1 张恩海;基于多自动机复合多子类机器博弈及其估值方法研究[D];沈阳大学;2011年
2 林靖;Q-学习在非完备信息机器博弈中的应用[D];哈尔滨工业大学;2009年
3 王小龙;连珠模式棋类博弈的搜索优化[D];安徽大学;2014年
4 连莲;基于Moore自动机的机器博弈系统建模与研究[D];东北大学;2009年
5 唐艳;围棋博弈机器学习算法的研究及应用[D];重庆理工大学;2012年
6 孟凡良;基于学习的九宫问题求解方法及其应用研究[D];国防科学技术大学;2007年
7 王骐;博弈树搜索算法的研究及改进[D];浙江大学;2006年
8 陈光年;基于智能算法的六子棋博弈行为选择的应用研究[D];重庆理工大学;2010年
9 谢国;中国象棋机器博弈数据结构设计与搜索算法研究[D];西安理工大学;2008年
10 张明亮;一种新的博弈树搜索算法及其应用研究[D];苏州大学;2007年
中国重要报纸全文数据库 前2条
1 记者 何鑫 通讯员 张燕霖;高交会“中国象棋人机大战”今开战[N];深圳商报;2009年
2 蒋佑铭;电脑围棋对弈技术的发展趋势[N];围棋报;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978