摘要: 在 强化学习实战 | 表格型Q-Learning玩井字棋(一)搭个框架 中,我们构建了以Game() 和 Agent() 类为基础的框架,本篇我们要让agent不断对弈,维护Q表格,提升棋力。那么我们先来盘算一下这几个问题: Q1:作为陪练的一方,策略上有什么要求吗? A1:有,出棋所导致的状态要完 阅读全文
posted @ 2021-12-09 14:22 埠默笙声声声脉 阅读(1606) 评论(0) 推荐(0) 编辑