会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
需要鼓励
博客园
首页
新随笔
联系
订阅
管理
2019年7月4日
强化学习笔记(一) Qlearning & Sarsa
摘要: 我的理解: Q learning Sarsa 在一个回合内: 初始化s 1. choose(s, Q) => action (策略) 2. move(action, s, Q) => s_ , R 3. Q_fresh(action, s, Q, s_, R) => new_Q (最大值策略) 4.
阅读全文
posted @ 2019-07-04 10:47 可爱小小畅
阅读(254)
评论(0)
推荐(0)
编辑
公告