摘要: 上篇总结了 Model Free Predict 问题及方法,本文内容介绍 Model Free Control 方法,即 "Optimise the value function of an unknown MDP"。 在这里说明下,Model Free Predict/Control 不仅适用于 阅读全文
posted @ 2018-10-31 10:40 Poll的笔记 阅读(2432) 评论(2) 推荐(0) 编辑