2019 年 12月 27 日随笔档案 - Easonshi

2019年12月27日

摘要： CS188: https://inst.eecs.berkeley.edu/~cs188/su19/ Berkeley 的材料，其中的 slides 和 note 都很棒；然后，想要刷题的话，可以在这里 https://edge.edx.org/courses/course v1:BerkeleyX 阅读全文

posted @ 2019-12-27 01:00 Easonshi 阅读(333) 评论(0) 推荐(0) 编辑

AI-RL

摘要：在 MDP 中，我们给出了 model（即转移 T 和奖励 R 的具体形式），然而，这种情况显然是理想的，要解决现实中的问题，我们一般不能得到 model，因此，就进入到了这个专题——强化学习 RL。和 MDP 中的概念类似，这里有状态集 S，动作集 A，对于我们的每个 $(s,a)$ 环境会给出阅读全文

posted @ 2019-12-27 00:50 Easonshi 阅读(379) 评论(0) 推荐(0) 编辑

Easonshi

a naive idiot

公告