会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
PT小陈
博客园
首页
新随笔
联系
订阅
管理
强化学习和监督学习的区别
强化学习和监督学习的区别
1、强化学习的样本通过不断与环境进行交互产生,即
试错学习
,而监督学习的样本由人工收集并标注。
2、强化学习的反馈信息只有
奖励
,并且是延迟的,而监督学习需要明确的指导信息(每一个状态对应的动作)。
博客内容用于记录自己学习后的收获,如有侵权请联系我删除
posted @
2020-09-28 15:25
PT小陈
阅读(
2481
) 评论(
0
)
编辑
收藏
举报
刷新页面
返回顶部
公告