摘要: 看了看之前写的那篇博客,感觉并没有真的总结清楚DRL是什么,难怪我一直不懂什么是DRL,原来是以前就没学好,所以现在从RL开始了解了解,了解RL之后再去了解DRL。 setup大部分,还是来自原本的博客,加了点注释。reform了一下,懒得再打公式了。 什么是RL 简介 什么是MDP Markov 阅读全文
posted @ 2021-12-20 17:09 xxxuanei 阅读(268) 评论(0) 推荐(0) 编辑