摘要: 本系列强化学习内容来源自对David Silver课程的学习 课程链接http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teaching.html 之前接触过RL(Reinforcement Learning) 并且在组会学习轮讲里讲过一次Policy Grad 阅读全文
posted @ 2020-01-25 06:13 水奈樾 阅读(4024) 评论(0) 推荐(1) 编辑