会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Poll的笔记
[三叶草精神] what hurts more,the pain of hard work or the pain of regret?
博客园
首页
联系
订阅
管理
2018年10月28日
[Reinforcement Learning] 马尔可夫决策过程
摘要: 在介绍马尔可夫决策过程之前,我们先介绍下情节性任务和连续性任务以及马尔可夫性。 情节性任务 vs. 连续任务 情节性任务(Episodic Tasks),所有的任务可以被可以分解成一系列情节,可以看作为有限步骤的任务。 连续任务(Continuing Tasks),所有的任务不能分解,可以看作为无限
阅读全文
posted @ 2018-10-28 10:05 Poll的笔记
阅读(9581)
评论(0)
推荐(3)
编辑
公告