随笔- 47 文章- 1 评论- 5 阅读- 48183

06 2020 档案

摘要：基于神经网络方法求解RL 项目地址：https://gitee.com/paddlepaddle/PARL/tree/develop/examples/tutorials/lesson3/dqn 1.函数逼近与神经网络 Lesson2中所述Sarsa、Q-learning均建立在Q表格的基础上，实际阅读全文

posted @ 2020-06-29 23:03 biiigwang 阅读(402) 评论(0) 推荐(0) 编辑

Lesson2 基于表格法求解RL

摘要：基于表格法求解RL 中相关概念含义 S state 状态(observe) A action 动作 R reward 奖励 P probability 状态转移概率 MDP Markov Decision Processes 马尔科夫决策过程(强化学习的基本框架) TD Temporal Diff 阅读全文

posted @ 2020-06-26 21:03 biiigwang 阅读(275) 评论(0) 推荐(0) 编辑

公告

昵称： biiigwang
园龄： 5年4个月
粉丝： 4
关注： 9

+加关注

2025年3月

日

一

二

三

四

五

六

biiigwang

我们可以卑微如尘土，但不可扭曲如蛆虫

06 2020 档案

公告

搜索

常用链接

我的标签

合集

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论