会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Sun Wenqi's Blog
Learn Data Science and Artificial Intelligence
2019年6月27日
强化学习基础:蒙特卡罗和时序差分
摘要: 承接文章强化学习基础:基本概念和动态规划,介绍另外两种解决强化学习问题的方法:蒙特卡罗法和时序差分法
阅读全文
posted @ 2019-06-27 20:36 sunwq06
阅读(511)
评论(0)
推荐(0)
编辑
导航
博客园
首页
新随笔
联系
订阅
管理