2019年3月19日

强化学习9-Deep Q Learning

摘要：之前讲到Sarsa和Q Learning都不太适合解决大规模问题，为什么呢？因为传统的强化学习都有一张Q表，这张Q表记录了每个状态下，每个动作的q值，但是现实问题往往极其复杂，其状态非常多，甚至是连续的，比如足球场上足球的位置，此时，内存将无力承受这张Q表。价值函数近似既然Q表太大，那么怎么阅读全文

posted @ 2019-03-19 18:28 努力的孔子阅读(1693) 评论(0) 推荐(0) 编辑

2019年3月19日

导航