会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
kane's Blog
博客园
首页
新随笔
联系
订阅
管理
Actor-Critic-Methods | 强化学习
Policy Network(Actor) 策略网络用来控制agent的运动
Value Network(Critic) 价值网络用来评价运动的表现
本文作者:Kane,转载请注明原文链接:
https://www.cnblogs.com/hackerk/p/17308472.html
posted @
2023-04-12 04:38
kingchou007
阅读(
13
) 评论(
0
)
编辑
收藏
举报
刷新页面
返回顶部
公告