2017 年 1月 14 日随笔档案 - CasperWin

笔下虽有千言，胸中实无一策

2017年1月14日

学习笔记 | Morvan - Reinforcement Learning, Part 3: Sarsa

摘要： Sarsa 什么是Sarsa 什么是Sarsa (lamda) 3.1 Sarsa 算法更新 3.2 Sarsa 思维决策 3.3 Sarsa-lambda Notes What is Sarsa? From Wikipedia: State-Action-Reward-State-Action ( 阅读全文

posted @ 2017-01-14 07:10 CasperWin 阅读(384) 评论(0) 推荐(0) 编辑

卡斯柏的博客

笔下虽有千言，胸中实无一策

公告