对游戏《 2048 》的一些思考

游戏《2048》是 Gabriele Cirulli出品手机数字游戏，以下给出百度介绍：

https://baike.baidu.com/item/2048/13383511?fr=aladdin

游戏的网上地址：

http://gabrielecirulli.github.io/2048/

github 上的源码地址：

https://github.com/gabrielecirulli/2048

今天，一位老友与我闲聊中提起了最近在玩的一个小程序，就是这个传说中的2048游戏，一开始并没有太在意，但是听老友多次提起也就有了一丢丢的兴趣，老友提到要自己写一个程序来让电脑自己玩这个游戏，并给出了自己的一些想法，听了以后感觉蛮神奇和高大上的，其思想可以概括为使用遗传算法和神经网络对该问题建模后进行求解，也就是说使用某种算法对问题的解空间进行搜索，这个想法咋一听起来感觉不错不错，细细想来又总感觉差一些什么，随后老友又具体的讲了一下想法，那就是采用两个神经网络对问题求解，一个负责棋子的移动，一个负责搜索，总之，感觉这个想法和有名的alfago 下围棋方法很像，只不过很无奈，alfago 过于高大上以至于只是听说过它的一些方法。

抱着好奇的态度我便打开了这个游戏的网址，直观感觉这个游戏很简单，随后我发现这个游戏和平时的棋盘类游戏还是有一些不同的。这个游戏的初始两个棋子的位置是完全随机的，虽然棋子可以是 2 和 4 中的任意一个（其中，是2 的概率为0.9，是4 的概率为0.1），但是这个初始状态可以看做是完全随机的，然后每一次移动棋子后产生的棋子也是随机的（2 的概率为0.9，是4 的概率为0.1），并且位置也是随机的。也就是说，这个游戏在下棋过程中所有的操作都是随机的，这个样子的话好像传统的那些解法不是很一样，虽然说不上是简单了还是容易的。

对于这个游戏的解法我的观点不太同于我的老友，我总感觉这个游戏的步骤是需要算下到每一步位置后能够WIN的概率或者是下一步可以更好的概率。

这个游戏每次操作可以选择上下左右四个方向的操作，也就是4种可供选择。每次操作后空白的位置假设为K，那么也就是说这次操作后棋盘可能变化成的状态为 4 × k ×2, ( 2是因为新生成的棋子可以是2 也可以是 4)。如果能够给出一个判断函数，来确定哪一种变化后的状态更优秀，当然还要考虑到变为该种状态的概率，那么也就是说我们要求下个状态的优秀估值和概率的乘积，即期望值，来选择下一步的操作。

有了以上想法后，本人决定亲自玩一次，给它打通关，结果万万没有想到整整打了一天也没有打赢，真心是败给它了。随后，在网上搜了搜其他网友给出的解决方法，搜到了这个不错的版本， 2048AI版本，以下给出具体地址：

http://ovolve.github.io/2048-AI/

github 地址：

https://github.com/ovolve/2048-AI

以下给出演示图：

为了可以更好的理解该游戏是如何运行及设计的，本人在网上找了一个PYTHON版本的代码，当然由于其界面为命令行，其效果难以与JS写的相比，以下给出地址：

http://rosettacode.org/wiki/2048#Python

#!/usr/bin/env python3
 
import curses
from random import randrange, choice # generate and place new tile
from collections import defaultdict
 
letter_codes = [ord(ch) for ch in 'WASDRQwasdrq']
actions = ['Up', 'Left', 'Down', 'Right', 'Restart', 'Exit']
actions_dict = dict(zip(letter_codes, actions * 2))
 
def get_user_action(keyboard):    
    char = "N"
    while char not in actions_dict:    
        char = keyboard.getch()
    return actions_dict[char]
 
def transpose(field):
    return [list(row) for row in zip(*field)]
 
def invert(field):
    return [row[::-1] for row in field]
 
class GameField(object):
    def __init__(self, height=4, width=4, win=2048):
        self.height = height
        self.width = width
        self.win_value = 2048
        self.score = 0
        self.highscore = 0
        self.reset()
 
    def reset(self):
        if self.score > self.highscore:
            self.highscore = self.score
        self.score = 0
        self.field = [[0 for i in range(self.width)] for j in range(self.height)]
        self.spawn()
        self.spawn()
 
    def move(self, direction):
        def move_row_left(row):
            def tighten(row): # squeese non-zero elements together
                new_row = [i for i in row if i != 0]
                new_row += [0 for i in range(len(row) - len(new_row))]
                return new_row
 
            def merge(row):
                pair = False
                new_row = []
                for i in range(len(row)):
                    if pair:
                        new_row.append(2 * row[i])
                        self.score += 2 * row[i]
                        pair = False
                    else:
                        if i + 1 < len(row) and row[i] == row[i + 1]:
                            pair = True
                            new_row.append(0)
                        else:
                            new_row.append(row[i])
                assert len(new_row) == len(row)
                return new_row
            return tighten(merge(tighten(row)))
 
        moves = {}
        moves['Left']  = lambda field:                                \
                [move_row_left(row) for row in field]
        moves['Right'] = lambda field:                                \
                invert(moves['Left'](invert(field)))
        moves['Up']    = lambda field:                                \
                transpose(moves['Left'](transpose(field)))
        moves['Down']  = lambda field:                                \
                transpose(moves['Right'](transpose(field)))
 
        if direction in moves:
            if self.move_is_possible(direction):
                self.field = moves[direction](self.field)
                self.spawn()
                return True
            else:
                return False
 
    def is_win(self):
        return any(any(i >= self.win_value for i in row) for row in self.field)
 
    def is_gameover(self):
        return not any(self.move_is_possible(move) for move in actions)
 
    def draw(self, screen):
        help_string1 = '(W)Up (S)Down (A)Left (D)Right'
        help_string2 = '     (R)Restart (Q)Exit'
        gameover_string = '           GAME OVER'
        win_string = '          YOU WIN!'
        def cast(string):
            screen.addstr(string + '\n')
 
        def draw_hor_separator():
            top = '┌' + ('┬──────' * self.width + '┐')[1:]
            mid = '├' + ('┼──────' * self.width + '┤')[1:]
            bot = '└' + ('┴──────' * self.width + '┘')[1:]
            separator = defaultdict(lambda: mid)
            separator[0], separator[self.height] = top, bot
            if not hasattr(draw_hor_separator, "counter"):
                draw_hor_separator.counter = 0
            cast(separator[draw_hor_separator.counter])
            draw_hor_separator.counter += 1
 
        def draw_row(row):
            cast(''.join('│{: ^5} '.format(num) if num > 0 else '|      ' for num in row) + '│')
 
        screen.clear()
        cast('SCORE: ' + str(self.score))
        if 0 != self.highscore:
            cast('HGHSCORE: ' + str(self.highscore))
        for row in self.field:
            draw_hor_separator()
            draw_row(row)
        draw_hor_separator()
        if self.is_win():
            cast(win_string)
        else:
            if self.is_gameover():
                cast(gameover_string)
            else:
                cast(help_string1)
        cast(help_string2)
 
    def spawn(self):
        new_element = 4 if randrange(100) > 89 else 2
        (i,j) = choice([(i,j) for i in range(self.width) for j in range(self.height) if self.field[i][j] == 0])
        self.field[i][j] = new_element
 
    def move_is_possible(self, direction):
        def row_is_left_movable(row): 
            def change(i): # true if there'll be change in i-th tile
                if row[i] == 0 and row[i + 1] != 0: # Move
                    return True
                if row[i] != 0 and row[i + 1] == row[i]: # Merge
                    return True
                return False
            return any(change(i) for i in range(len(row) - 1))
 
        check = {}
        check['Left']  = lambda field:                                \
                any(row_is_left_movable(row) for row in field)
 
        check['Right'] = lambda field:                                \
                 check['Left'](invert(field))
 
        check['Up']    = lambda field:                                \
                check['Left'](transpose(field))
 
        check['Down']  = lambda field:                                \
                check['Right'](transpose(field))
 
        if direction in check:
            return check[direction](self.field)
        else:
            return False
 
def main(stdscr):
    curses.use_default_colors()
    game_field = GameField(win=32)
    state_actions = {} # Init, Game, Win, Gameover, Exit
    def init():
        game_field.reset()
        return 'Game'
 
    state_actions['Init'] = init
 
    def not_game(state):
        game_field.draw(stdscr)
        action = get_user_action(stdscr)
        responses = defaultdict(lambda: state)
        responses['Restart'], responses['Exit'] = 'Init', 'Exit'
        return responses[action]
 
    state_actions['Win'] = lambda: not_game('Win')
    state_actions['Gameover'] = lambda: not_game('Gameover')
 
    def game():
        game_field.draw(stdscr)
        action = get_user_action(stdscr)
        if action == 'Restart':
            return 'Init'
        if action == 'Exit':
            return 'Exit'
        if game_field.move(action): # move successful
            if game_field.is_win():
                return 'Win'
            if game_field.is_gameover():
                return 'Gameover'
        return 'Game'
 
    state_actions['Game'] = game
 
    state = 'Init'
    while state != 'Exit':
        state = state_actions[state]()
 
curses.wrapper(main)

对于该游戏的 AI 版本，外国技术网站上有以下的分析：

https://stackoverflow.com/questions/22342854/what-is-the-optimal-algorithm-for-the-game-2048/22389702#22389702

对于该游戏，个人的观点则是AI版本的重点是在各个评分函数的选择上，对此由于源码是JS写的，并不熟悉，再加上并无太多注解，对于外文论坛上的分析也是看得似懂非懂，不甚了了。

posted on 2017-10-28 22:41 Angry_Panda 阅读(1417) 评论(0) 收藏举报

刷新页面返回顶部

Angry Panda（T-800）