会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
埠默笙声的博客
博客园
首页
新随笔
联系
订阅
管理
2022年1月26日
强化学习实战:自定义Gym环境之扫雷
摘要: 开始之前 先考虑几个问题: Q1:如何展开无雷区? Q2:如何计算格子的提示数? Q3:如何表示扫雷游戏的状态? Q4:如何设置环境中的奖励? A1:可以使用递归函数,或是堆栈。 A2:一般的做法是,需要打开某格子时,再去统计周围的雷数。如果有方便的二维卷积函数可以调用,这会是个更简洁的方法: $$
阅读全文
posted @ 2022-01-26 21:56 埠默笙声声声脉
阅读(925)
评论(0)
推荐(0)
编辑
公告