会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Roger_Ceng
博客园
首页
新随笔
联系
管理
订阅
2019年5月14日
复现一篇深度强化学习论文之前请先看了这篇文章!
摘要: 去年,OpenAI和DeepMind联手做了当时最酷的实验,不用经典的奖励信号来训练智能体,而是根据人类反馈进行强化学习的新方法。有篇博客专门讲了这个实验 Learning from Human Preferences,原始论文是《 Deep Reinforcement Learning from
阅读全文
posted @ 2019-05-14 07:44 Roger_Ceng
阅读(1099)
评论(0)
推荐(0)
编辑
公告