2019年2月14日

机器学习工程师 - Udacity 强化学习 Part Four

摘要: 五、蒙特卡洛方法 1.状态值 如果你想详细了解首次经历和所有经历 MC 方法之间的区别,建议你阅读此论文的第 3 部分。结果在第 3.6 部分进行了总结。作者指出: 所有经历 MC 存在偏差,而首次经历 MC 不存在偏差(请参阅 Theorems 6 和 7)。 一开始,所有经历 MC 具有更低的均 阅读全文

posted @ 2019-02-14 15:55 paulonetwo 阅读(781) 评论(0) 推荐(0) 编辑

导航