随笔分类 - 强化学习

强化学习之Sarsa （时间差分学习）

摘要：上篇文章讲到Q-learning, Sarsa与Q-learning的在决策上是完全相同的，不同之处在于学习的方式上这次我们用openai gym的Taxi来做演示 Taxi是一个出租车的游戏，把顾客送到目的地+20分，每走一步-1分，如果在路上把乘客赶下车的话扣10分简要 Sarsa是一种在线阅读全文

posted @ 2018-01-11 17:11 寂夜云阅读(1503) 评论(0) 推荐(1) 编辑

强化学习之Q-learning ^_^

摘要：许久没有更新重新拾起，献于小白这次介绍的是强化学习 Q-learning，Q-learning也是离线学习的一种关于Q-learning的算法详情看传送门下文中我们会用openai gym来做演示简要 q-learning的伪代码先看这部分，很重要简单的算法语言描述就是开始执行任务: 阅读全文

posted @ 2018-01-10 15:10 寂夜云阅读(5729) 评论(0) 推荐(0) 编辑

公告

昵称：寂夜云
园龄： 9年7个月
粉丝： 43
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

寂夜云

婴其呜矣，求其友声

随笔分类 - 强化学习

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论