摘要: 主要参考的资料是Sutton的强化学习书和UCL强化学习的课程。 1.强化学习在机器学习中的位置 强化学习的学习思路和人比较类似,是在实践中学习,比如学习走路,如果摔倒了,那么我们大脑后面会给一个负面的奖励值,说明走的姿势不好。然后我们从摔倒状态中爬起来,如果后面正常走了一步,那么大脑会给一个正面的 阅读全文
posted @ 2019-07-23 23:14 不同的日子丶看不同的云 阅读(421) 评论(0) 推荐(0) 编辑