摘要:
CS188: https://inst.eecs.berkeley.edu/~cs188/su19/ Berkeley 的材料,其中的 slides 和 note 都很棒;然后,想要刷题的话,可以在这里 https://edge.edx.org/courses/course v1:BerkeleyX 阅读全文
摘要:
在 MDP 中,我们给出了 model(即转移 T 和奖励 R 的具体形式),然而,这种情况显然是理想的,要解决现实中的问题,我们一般不能得到 model,因此,就进入到了这个专题——强化学习 RL。 和 MDP 中的概念类似,这里有状态集 S,动作集 A,对于我们的每个 $(s,a)$ 环境会给出 阅读全文