2021 年 12月 9 日随笔档案 - 埠默笙声声声脉

2021年12月9日

摘要：在强化学习实战 | 表格型Q-Learning玩井字棋（一）搭个框架中，我们构建了以Game() 和 Agent() 类为基础的框架，本篇我们要让agent不断对弈，维护Q表格，提升棋力。那么我们先来盘算一下这几个问题： Q1：作为陪练的一方，策略上有什么要求吗？ A1：有，出棋所导致的状态要完阅读全文

posted @ 2021-12-09 14:22 埠默笙声声声脉阅读(1673) 评论(0) 推荐(0) 编辑

公告