会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
一丨
博客园
首页
新随笔
联系
订阅
管理
2021年9月30日
Q -learning入门
摘要: 算法思想 Q-Learning是强化学习算法中value-based的算法,Q即为Q(s,a),就是在某一个时刻的state状态下,采取动作a能够获得收益的期望,环境会根据agent的动作反馈相应的reward奖赏, 所以算法的主要思想就是将state和action构建成一张Q_table表来存储Q
阅读全文
posted @ 2021-09-30 19:49 一丨
阅读(463)
评论(0)
推荐(0)
编辑
公告