RL 基础 | 如何搭建自定义 gym 环境

需实现的方法:

  • __init__(self):
    • 需定义 action_space 和 observation_space,使用 space.Box 之类来表示(from gym import spaces)。
  • step(self, action):
    • 返回
      • observation (object) 。
      • reward (float) 。
      • done (bool):当前 episode 是否结束。
      • info (dict):其他信息。
    • 输出值(如 observation)最好是 np.ndarray。
  • reset(self):reset 整个环境,返回 observation。

有用的教程:

posted @ 2023-03-03 11:03  MoonOut  阅读(193)  评论(0编辑  收藏  举报