摘要: 1.Monte-Carlo Reinforcement Learning a)MC方法直接从经历中的episodes中学习 b)MC方法是无模型的, c)从完整的episodes中学习:而不是走一步学学一步(bootstrapping) d)注意:只能将MC方法应用到episodic MDPs,而且 阅读全文
posted @ 2017-04-14 21:37 陈煜弘 阅读(273) 评论(0) 推荐(0) 编辑
摘要: 1.生成dot 2.根据生成的dot生成png图 3.结果: 4.使用代码 阅读全文
posted @ 2017-04-14 12:18 陈煜弘 阅读(218) 评论(0) 推荐(0) 编辑