新手立体四子棋AI教程(1)——基础扫盲

一、引言

最近身边好几个朋友开始玩立体四子棋,激起了我的好奇心。那么首先来说什么是【立体四子棋】,规则又是如何呢?

上图即为立体四子棋,规则类似于五子棋四子连在一起,但是四子棋更加多样、丰富。不仅可以在平面内横竖斜四子连在一起,还可以在不同平面内四子斜着连在一起、同一根柱子上四子连在一起,可谓十分有趣。

二、规则介绍

那么我们用科学的方法总结一下规则:

情况一:xy平面内横竖斜四子连成

上图中的三种情况,可以推广到任意z平面

情况二:立体中四子斜着连成

以上情况同样可以在同一x轴上、同一y轴上成立

情况三:

这种情况在任意位置均成立,即z轴上四子连成

三、设计思路

鉴于立体四子棋脱胎于五子棋,那么我们可以在传统五子棋的AI算法上进行我们的创作。首先对于棋盘来说,五子棋可下的位置一共有15*15=225个,立体四子棋可下的位置有4*4*4=64个,并且由于空间限制,任何一步内的可下位置不会超过16个。这是因为不能违背物理限制,落子时棋子的下方必须不为空。

那么我们可以简单的建立一个int[4][4][4]来表示当前棋盘状态,此处不需要过多解释。对于棋盘的各种状态,我们可以通过一个enum chessPicesStatus{empty, black, white}来描述一个位置的情况。同样我们建立一个棋子位置的结构体来提供更多的信息:(value的作用后续会在提到)

enum chessPicesStatus{empty, black, white};
struct PicesPos{
    int x;
    int y;
    int z;
    chessPicesStatus type;
    int value;
};

 

说完这些,我们再来聊聊真正的算法部分。立体四子棋和其他棋类如五子棋、围棋、国际象棋一样,均为【零和博弈】,以下为维基百科中的定义

在零和属性(如果一方得益,另一方必然损失)下,是指结果是零和的情况下会出现帕累托最优的现象。反过来说,全体参加者可得益或受损的情况被称为非零和博弈。如果一个国家利用其过剩的香蕉与另一国家剩余的苹果进行贸易,因为两方都从交易中受惠,这是一个非零和的例子。

这个概念最早是在博弈论(game theory)上发展,因此零和情况通常被称为零和游戏(zero-sum game)。

翻译一下,棋类零和游戏必须满足的几点:

  1. 整个棋盘必须是透明的,即游戏双方都可以了解到棋盘所有的信息
  2. 双方轮流出棋
  3. 在规则下必定出现一方胜利,一方失败的局面,或者产生和棋

目前在这类博弈中算法大部分已经相当成熟,基本都采用暴力搜索,模拟未来n步走子产生最优位置。但是鉴于棋类巨大的可能性,模拟出未来的每种可能性是不现实的,因此,模拟出尽可能多的步数是大家努力的目标。举个例子,著名围棋Ai Alpha Go,核心的地方在于在突破传统的蒙特卡洛搜索树,采用预先训练好的【价值评估网络】和【走子网络】两个神经网络来评估,缩小了每层的搜索量,并且配以Google的TPU,实现超越人类棋手。

在我们这次的程序中,将采用极值(极大极小)算法,以及启发式搜索,并配以alpha-beta剪枝来优化搜索量。鉴于立体四子棋每层16个位置的搜索,我们暂时还用不到蒙特卡洛搜索树和神经网络。

 

四、基本功能

好了,既然理论知识已经扫盲完成(没明白也没关系,后续还会再详细介绍),我们快速构建一下之后会用到的各个功能。

首先定义chessBoard类,提供如下方法:

 

typedef std::vector<PicesPos> PicesPosList;

class ChessBoard
{
public:
    int chessBoard[4][4][4];

    void init();
    bool insertPices(int x,int y,int type);
    void printBoard();

    PicesPosList getAvailablePos(int board[4][4][4],chessPicesStatus side);
}

 

接着我们来依次实现:

首先是初始化,鉴于未来我们会重复使用棋盘,这个方法还是有一定必要性的。

 

void ChessBoard::init()
{
    for(int z = 0;z < 4;z++)
    {
        for(int y = 0;y < 4;y++)
        {
            for(int x = 0;x < 4;x++)
            {
                chessBoard[x][y][z] = chessPicesStatus::empty;
            }
        }
    }
}

 

 很简单,然后我们实现落子的方法。在此需要保证几点:

  1. 这个位置是存在的
  2. 这个位置并没有落满
  3. 插入中不能出现悬空的状态
bool ChessBoard::insertPices(int x, int y, int type)
{
    if(x < 0 || x >3 || y < 0 || y > 3)
        return false;

    //check 0-3th floor
    for(int z = 0;z < 4;z++)
    {
        if(chessBoard[x][y][z] == chessPicesStatus::empty)
        {
            chessBoard[x][y][z] = chessPicesStatus(type);
            return true;
        }
    }

    return false;
}

 

同样没什么难度,接着我们来看打印函数,这个函数只是让我们能方便的看到棋盘情况,真正项目中还需要用更友好的UI来替代。

void ChessBoard::printBoard()
{
    for(int z = 0;z < 4;z++)
    {
        cout<<"The "<<z<<"th floor"<<endl;
        for(int y = 0;y < 4;y++)
        {
            for(int x = 0;x < 4;x++)
            {
                cout<<chessBoard[x][y][z]<<" ";
            }
            cout<<endl;
        }
        cout<<"\\\\\\\\\\\\\\"<<endl;
    }
}

 

打印效果如下:

The 0th floor
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
\\\\\\\
The 1th floor
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
\\\\\\\
The 2th floor
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
\\\\\\\
The 3th floor
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
\\\\\\\

 

最后我们来看下稍有难度的获取当前可下位置的方法,其实也很简单:

PicesPosList ChessBoard::getAvailablePos(int board[4][4][4], chessPicesStatus side)
{
    PicesPosList availablePos;

    for(int y = 0;y < 4;y++)
    {
        for(int x = 0;x < 4;x++)
        {
            for(int z = 0; z < 4;z++)
            {
                if(board[x][y][z] == chessPicesStatus::empty)
                {
                    PicesPos pos;
                    pos.x = x;
                    pos.y = y;
                    pos.z = z;
                    pos.type = chessPicesStatus::empty;
                    pos.value = getPosValue(board,&pos,side);
                    availablePos.push_back(pos);
                    break;
                }
            }
        }
    }

    return availablePos;
}

 

基本就是对于每个x,y,从下往上找可用位置,找到后退出。其中side参数和getPosValue(board,&pos,side)是我们之后会提到的启发式搜索所用到的价值评估函数,可以先行略过。

至此,我们已经构建了一个基本的棋盘,配上简单的io交互就可以在这上面下棋了!

在之后的几篇文章,我会讲到胜负判断、当前局势分评估、搜索树的构建,剪枝算法优化,启发式搜索等内容,敬请期待!

 

参考博文:

http://blog.csdn.net/lihongxun945/article/details/50625267

https://www.cnblogs.com/pangxiaodong/archive/2011/05/26/2058864.html

https://www.zhihu.com/question/27221568

致谢!

posted on 2018-03-23 13:12  Scobbing  阅读(8333)  评论(3编辑  收藏  举报

导航