会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Be(CN₃H₃)₂
博客园
首页
新随笔
联系
订阅
管理
随笔分类 -
RL
【论文翻译-RL×Diffusion】Planning with Diffusion for Flexible Behavior Synthesis
摘要:
Levine 组 2022 年的顶会之一,扩散模型×强化学习的开山之作。
阅读全文
posted @
2023-05-15 18:44
Be(CN₃H₃)₂
阅读(4014)
评论(0)
推荐(2)
从 VPG 到 PPO
摘要:
VPG->自然策略梯度->TRPO->PPO
阅读全文
posted @
2023-05-02 22:32
Be(CN₃H₃)₂
阅读(279)
评论(0)
推荐(0)
公告