会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
黎明程序员
博客园
首页
联系
管理
订阅
2020年10月4日
强化学习框架RLlib教程003:Training APIs的使用(二)基础pythonAPI
摘要: 目录 基础pythonAPI概览 计算动作(Computing Actions) 获取策略状态(Accessing Policy State) 获取模型状态(Accessing Model State) 例子:预处理喂给model的观测值 例子:查询一个policy的动作分布 例子:从DQN模型中获
阅读全文
posted @ 2020-10-04 22:22 黎明程序员
阅读(1686)
评论(0)
推荐(0)
编辑
公告