亲测可用的 Linux(Ubuntu18.04下)可运行的俄罗斯方块游戏的仿真环境—————————可用于强化学习算法的游戏模拟器环境
俄罗斯方块模拟器(tetris 游戏),Python库地址:
https://gitee.com/devilmaycry812839668/gym-tetris
在Python3.7环境下亲测可用:
安装:
pip install gym-tetris
安装好后测试代码:
from nes_py.wrappers import JoypadSpace import gym_tetris from gym_tetris.actions import MOVEMENT env = gym_tetris.make('TetrisA-v0') env = JoypadSpace(env, MOVEMENT) done = True for step in range(5000): if done: state = env.reset() state, reward, done, info = env.step(env.action_space.sample()) env.render() env.close()
由于上面代码运行过快,不易观察,于是给出修正代码:
from nes_py.wrappers import JoypadSpace import gym_tetris from gym_tetris.actions import MOVEMENT import time env = gym_tetris.make('TetrisA-v0') env = JoypadSpace(env, MOVEMENT) done = True for step in range(5000): if done: state = env.reset() state, reward, done, info = env.step(env.action_space.sample()) print(info) env.render() time.sleep(0.5) env.close()
运行图:
该游戏也可以使用命令启动,进行随机或者人为交互:
命令:
gym_tetris -e <environment ID> -m <`human` or `random`>
其中,
<environment ID> 可以是:
TetrisA-v0
TetrisA-v1
TetrisA-v2
TetrisA-v3
TetrisB-v0
TetrisB-v1
TetrisB-v2
TetrisB-v3
如:
gym_tetris -e TetrisA-v0 -m random
如:
gym_tetris -e TetrisA-v0 -m human
消除的行数与得分关系:(游戏规则)
引自:http://news.4399.com/gonglue/elsfangkuai/xinde/m/321661.html
俄罗斯方块是通过消除填满的行数来进行计分的,最高同时消除4行。消除行数最高,分数得到也就越多。
1.消除1行得10分,因为单行消除时最简单的,分数高不到哪去。
2.消除2行得30分,分数开始激增了,30分还不错。
3.消除3行得60分,分数更高,但是难度也是随之增加。
4.消除4行得100分,用这个来打高分是最快的,但是一不小心就可能挂掉。
这里说的几行是指一次性消除的行数。
==============================================================
其中,使用该模拟器与环境交互时返回的info消息的格式如下:
更多消息参看项目说明文件。
==============================================================
补充一下:
info 信息中的 board_height 是指当前落底的方块最高的高度:
可以看到上图中落底方块的最高高度为4, 于是 board_height 的数值为4 。
在 'statistics' 中, 方块的种类分别表示为:
'T'
'J'
'Z'
'O'
'S'
'L'
'I'
而每一种类型由于可以选择变形,变形不同样式后又用不同字符串表示:
r 、 l 、u 、 d 分别代表 right, left, up ,down 四个变形格式。
v,h 分别代表 垂直和水平。
如:块类型 T, 他可以被表示为四种变化格式,"Tr", "Tl", "Tu", "Td" , 这也是'current_piece'中所进行的表示。
块类型I, 可以表示为 v, h 两个格式,于是有 "Iv", "Ih" 这两种'current_piece'中所进行的表示 。
next_piece 可以指出下一个新块的类型,如下图,"I"块(和‘I块的两个具体格式 Iv 或 Ih 无关’)的下一个块为‘Td’块:
===========================================================
该游戏进行 human 模式 人为交互是 ,上下左右使用 w、a、s、d 键, 变形使用 O 或 P 键。
posted on 2021-07-02 14:31 Angry_Panda 阅读(509) 评论(0) 编辑 收藏 举报