会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
SilentSamsara
博客园
首页
新随笔
联系
管理
订阅
2021年11月8日
学习日志-2021.11.08
摘要: 学习日志-2021.11.08 其他Q-Learning SA-Q-learning 为了平衡Q-learning的探索与利用,基于Metropolis准则提出的算法 算法描述 初始化Q表 对每一轮次(episode): 随机选择或初始化一个状态 \(s_t\) 对于每一步(step): 从动作空间
阅读全文
posted @ 2021-11-08 21:55 SilentSamsara
阅读(25)
评论(0)
推荐(1)
编辑