2020 年 10月 4 日随笔档案 - 黎明程序员

2020年10月4日

强化学习框架RLlib教程003：Training APIs的使用（二）基础pythonAPI

摘要：目录基础pythonAPI概览计算动作（Computing Actions）获取策略状态（Accessing Policy State）获取模型状态（Accessing Model State）例子：预处理喂给model的观测值例子：查询一个policy的动作分布例子：从DQN模型中获阅读全文

posted @ 2020-10-04 22:22 黎明程序员阅读(1710) 评论(0) 推荐(0) 编辑

黎明程序员

公告