摘要: **发表时间:**2021(ICML 2021) **文章要点:**文章把MCTS扩展到带随机状态转移和部分可观测下。主要做法就是用VQ-VAE(参看Neural Discrete Representation Learning)自编码器来捕获一个动作可能造成的不同状态转移,然后和之前一样plann 阅读全文
posted @ 2021-08-16 06:39 initial_h 阅读(190) 评论(0) 推荐(0) 编辑