RL 基础 | 如何搭建自定义 gym 环境

需实现的方法：

__init__(self)：
- 需定义 action_space 和 observation_space，使用 space.Box 之类来表示（from gym import spaces）。
step(self, action)：
- 返回
  - observation (object) 。
  - reward (float) 。
  - done (bool)：当前 episode 是否结束。
  - info (dict)：其他信息。
- 输出值（如 observation）最好是 np.ndarray。
reset(self)：reset 整个环境，返回 observation。

有用的教程：

posted @ 2023-03-03 11:03 MoonOut 阅读(470) 评论(0) 收藏举报

刷新页面返回顶部