会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
凯鲁嘎吉
用书写铭记日常,最迷人的不在远方
博客园
首页
新随笔
新文章
订阅
管理
2022年11月19日
Safe RL——Constrained Policy Optimization (CPO)
摘要: Safe RL——Constrained Policy Optimization (CPO) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 这篇文章详细讲解Constrained Policy Optimization (CPO)的公式推导,文献来自
阅读全文
posted @ 2022-11-19 10:44 凯鲁嘎吉
阅读(1485)
评论(0)
推荐(0)
编辑