摘要:
labuladong 题解思路 难度中等172 给你一个大小为 m x n 的二进制矩阵 grid ,其中 0 表示一个海洋单元格、1 表示一个陆地单元格。 一次 移动 是指从一个陆地单元格走到另一个相邻(上、下、左、右)的陆地单元格或跨过 grid 的边界。 返回网格中 无法 在任意次数的移动中离 阅读全文
摘要:
完整代码:https://github.com/zle1992/Reinforcement_Learning_Game 开山之作: 《Playing Atari with Deep Reinforcement Learning》(NIPS) http://export.arxiv.org/pdf/1 阅读全文