2020 年 9月 26 日随笔档案 - Uzuki

2020年9月26日

摘要：最近在搞强化学习（Reinforcement Learning），打算把之前写的笔记整理一下本文基于大卫希尔维（David Silver）教授的强化学习概论课程，视频中所采用的样例学生马尔科夫链（Student MDPs）有时间再补上去出处：[https://www.youtube.com/watch?v=lfHX2hHRMVQ&list=PLqYmG7hTraZDM-OYHWgPebj2MfCFzFObQ&index=2]() 阅读全文

posted @ 2020-09-26 10:04 Uzuki 阅读(718) 评论(0) 推荐(1) 编辑

Uzuki

公告