会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
埠默笙声的博客
博客园
首页
新随笔
联系
订阅
管理
2021年12月9日
强化学习实战:表格型Q-Learning玩井字棋(二)开始训练!
摘要: 在 强化学习实战 | 表格型Q-Learning玩井字棋(一)搭个框架 中,我们构建了以Game() 和 Agent() 类为基础的框架,本篇我们要让agent不断对弈,维护Q表格,提升棋力。那么我们先来盘算一下这几个问题: Q1:作为陪练的一方,策略上有什么要求吗? A1:有,出棋所导致的状态要完
阅读全文
posted @ 2021-12-09 14:22 埠默笙声声声脉
阅读(1606)
评论(0)
推荐(0)
编辑
公告