会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
人工智站
博客园
首页
联系
订阅
管理
2019年2月17日
强化学习-蒙特卡罗法
摘要: 1. 前言 从本章起,我们开始解决更贴近实际的问题。前面提到我们接触过的问题有一个特点,即我们可以知道环境运转的细节,具体说就是知道状态转移概率$P(s_{t+1}|s_t,a_t)$。对蛇棋来说,我们可以看到蛇棋的棋盘,也就可以了解到整个游戏的全貌,这时我们相当于站在上帝视角,能够看清一切情况。
阅读全文
posted @ 2019-02-17 22:09 hyc339408769
阅读(2205)
评论(0)
推荐(0)
编辑
公告