RL 基础 | 如何搭建自定义 gym 环境
需实现的方法:
- __init__(self):
- 需定义 action_space 和 observation_space,使用 space.Box 之类来表示(from gym import spaces)。
- step(self, action):
- 返回
- observation (object) 。
- reward (float) 。
- done (bool):当前 episode 是否结束。
- info (dict):其他信息。
- 输出值(如 observation)最好是 np.ndarray。
- 返回
- reset(self):reset 整个环境,返回 observation。
有用的教程: