摘要: 之前学习动态规划,没少刷这类题,这次分享一个基于动态规划的增强学习算法。 故事案例:骑士和公主 假设你是一名骑士,并且你需要拯救上面的地图里被困在城堡中的公主。 你每次可以移动一个方块的距离。敌人是不能移动的,但是如果你和敌人落在了同一个方块中,你就会死。你的目标是以尽可能快的路线走到城堡去。这可以 阅读全文
posted @ 2019-06-09 22:35 messi2017 阅读(129) 评论(0) 推荐(0) 编辑