摘要: 强化学习大致上可分为两类,一类是Markov Decision Learning,另一类是与之相对的Model Free Learning 分为这两类是站在问题描述的角度上考虑的。同样在解决方案上存在着两种方法对应着这两类问题描述,即Dynamic Programming(DP)和Stochasti 阅读全文
posted @ 2018-07-27 11:15 JinyuBlog 阅读(2786) 评论(0) 推荐(0) 编辑