爱恩斯坦棋计算机博弈关键技术研究

代理获取

页面导航

摘要
著录项
相似文献
相关主题

摘要

计算机博弈是人工智能领域的重要研究方向之一，被誉为人工智能学科的“果蝇”。爱恩斯坦棋属于完备信息博弈棋种，是一种棋局信息完全透明的博弈类型，即博弈双方在任何时候都能完全掌握当前的棋局信息。然而，它不同于其它的完备信息博弈棋种，在双方行棋过程中需通过投掷骰子来确定可走的棋子，具有随机性，这使博弈系统对棋盘局势的分析和决策带来一定的挑战。自2012年爱恩斯坦棋被列为中国大学生计算机博弈大赛项目之后，国内越来越多的人专注于研究针对爱恩斯坦棋的博弈技术。现有估值函数的研究往往是从进攻、防守和概率三个因素分析局势的优劣，将这些因素以不同权重线性相加来组成估值函数。通过这种方式构造的估值函数一般会受到设计者自身博弈水平的限制，而且很难得到一个最优的权重。此外，搜索算法的研究大多是针对Alpha-Beta搜索算法和期望极大极小搜索算法的改进，但是这些搜索算法过于依赖估值函数，估值函数的好坏决定了整个博弈系统的水平。本文以爱恩斯坦棋为研究对象，研究爱恩斯坦棋计算机博弈的关键技术。在搜索算法方面，本文引入蒙特卡洛树搜索(Monte-Carlo tree search，MCTS)算法，提出了概率启发的并行MCTS算法，用概率节点表示投骰子事件，以多对多的方式连接其子节点，并对概率节点进行并行效率优化。在估值方面，本文设计爱恩斯坦棋特征向量的表示方法，使用基于多层感知机的价值网络进行估值，并在训练过程中将价值网络与概率启发的MCTS算法结合，提高样本质量和棋力。在博弈系统方面，设计并实现了爱恩斯坦棋博弈系统，具有人机交互、自动化对弈、棋谱存取以及训练网络等功能，建立了计算机博弈算法设计与分析的验证工具。本文的主要创新点如下: (1)在博弈树搜索方面，设计了用于表示随机事件的数据结构，并提出了概率启发的并行蒙特卡洛树搜索算法。一方面，在博弈树中使用概率节点来表示掷骰子事件，使用多对多的形式连接概率节点和最大值或最小值节点;另一方面，将蒙特卡洛树搜索算法用于上述博弈树中，并对该算法的并行化方法做优化。通过实验分析和实践证明，概率启发的并行蒙特卡洛树搜索算法具有较高的搜索效率和智能水平，并在2018年中国大学生计算机博弈大赛荣获亚军（一等奖）; (2)在估值方法方面，本文研究并设计了基于多层感知机的价值网络，以评估棋盘对当前行棋方的价值。首先，本文从棋盘盘面中提取48维的特征向量，设计价值网络模型，并与概率启发的并行蒙特卡洛树搜索算法结合。其次，从AlphaGo Zero程序中得到启发，设计了样本采集、网络训练和棋力评估三个阶段的价值网络的训练过程。通过实验分析，本文提出的价值网络模型经过训练后有较高的智能水平，并且结合价值网络的概率启发并行蒙特卡洛树搜索算法以55.3％的胜率战胜未结合价值网络的算法; (3)在博弈系统方面，本文设计并实现了爱恩斯坦棋博弈系统，包括训练子系统和对弈交互子系统。训练子系统用于执行和管理价值网络的训练进程，根据用户输入的相关参数训练神经网络，查看和保存训练过程中的误差和胜率变化，存取训练完成的网络模型;对弈交互子系统提供用户与系统中的算法进行对弈的功能，用户可选择系统中已有策略，手动设置策略参数，实现人-人、人-机和机-机自动对弈，将对弈过程可视化，并存储对弈棋谱。综上所述，本文在搜索、估值与系统三个方面进行爱恩斯坦棋计算机博弈技术的研究。首先，针对随机性的问题对蒙特卡洛树搜索算法进行了修正和并行优化，提升算法的搜索效率和智能水平;其次，设计了基于多层感知机的价值网络模型及其训练方法，进一步提升棋力;最后，实现了爱恩斯坦棋博弈系统，建立计算机博弈算法设计与分析的验证工具。

著录项

作者
陆梦轩;
展开▼
作者单位

安徽大学;

展开▼
授予单位安徽大学;
学科计算机科学与技术
授予学位硕士
导师姓名李学俊;
年度 2019
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;自动化基础理论;
关键词
计算机博弈;

相似文献

中文文献
外文文献
专利

1. 爱恩斯坦棋计算机博弈算法研究与改进 [J] . 杨昌杰 ,陈柯成 ,刘跃元 . 无线互联科技 . 2018,第015期
2. UCT算法在爱恩斯坦棋中的应用研究 [J] . 欧宇 ,李媛 ,王静文 . 计算机应用研究 . 2020,第S01期
3. 爱恩斯坦棋评估策略的研究 [J] . 范博奇 ,丁濛 ,张芳梓 . 智能计算机与应用 . 2018,第001期
4. 爱恩斯坦棋评估策略的研究 [J] . 范博奇1 ,丁濛12 ,张芳梓1 . 智能计算机与应用 . 2018,第001期
5. 改进UCT算法在爱恩斯坦棋中的应用 [J] . 张小川 ,李琴 ,南海 . 计算机科学 . 2018,第012期
6. 基于爱恩斯坦棋的程序设计课程教学案例设计 [C] . 王亚杰 ,王晓岩 ,邱虹坤 . 2012年全国智能科学与技术教育暨教学学术研讨会 . 2012
7. 爱恩斯坦棋计算机博弈算法的研究与实施 [A] . 李琴 . 2018

爱恩斯坦棋计算机博弈关键技术研究

摘要

著录项

相似文献

相关主题

期刊订阅