摘要: 在强化学习(一)模型基础中,我们讲到了强化学习模型的8个基本要素。但是仅凭这些要素还是无法使用强化学习来帮助我们解决问题的, 在讲到模型训练前,模型的简化也很重要,这一篇主要就是讲如何利用马尔科夫决策过程(Markov Decision Process,以下简称MDP)来简化强化学习的建模。 MDP 阅读全文
posted @ 2019-06-24 11:13 瘋耔 阅读(417) 评论(0) 推荐(0) 编辑
跳至侧栏