2019 年 3月 28 日随笔档案 - 蓝鲸王子

2019年3月28日

摘要：本文主要介绍强化学习的一些基本概念：包括MDP、Bellman方程等, 并且讲述了如何从 MDP 过渡到 Reinforcement Learning。 1. 强化学习基本概念这里还是放上David Silver的课程的图，可以很清楚的看到整个交互过程。这就是人与环境交互的一种模型化表示，在每个时阅读全文

posted @ 2019-03-28 16:53 蓝鲸王子阅读(3828) 评论(0) 推荐(2) 编辑

公告