会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Uzuki
博客园
首页
新随笔
联系
订阅
管理
2020年9月26日
机器学习 | 强化学习(1) | 马尔科夫决策过程(MDP)概论
摘要: 最近在搞强化学习(Reinforcement Learning),打算把之前写的笔记整理一下 本文基于大卫 希尔维(David Silver)教授的强化学习概论课程,视频中所采用的样例学生马尔科夫链(Student MDPs)有时间再补上去 出处:[https://www.youtube.com/watch?v=lfHX2hHRMVQ&list=PLqYmG7hTraZDM-OYHWgPebj2MfCFzFObQ&index=2]()
阅读全文
posted @ 2020-09-26 10:04 Uzuki
阅读(718)
评论(0)
推荐(1)
编辑
公告