会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
埠默笙声的博客
博客园
首页
新随笔
联系
订阅
管理
2021年12月5日
强化学习实战:自定义Gym环境
摘要: 新手的第一个强化学习示例一般都从Open Gym开始。在这些示例中,我们不断地向环境施加动作,并得到观测和奖励,这也是Gym Env的基本用法: state, reward, done, info = env.step(action) 其中state是agent的观测状态,reward是采取了act
阅读全文
posted @ 2021-12-05 11:48 埠默笙声声声脉
阅读(7530)
评论(0)
推荐(1)
编辑
公告