摘要: **发表时间:**2021 **文章要点:**这篇文章主要想看看muzero里面的model具体学到了什么表征。通过PCA降维的方式,发现最开始编码状态的h函数学到的embedding和动态转移函数g学到的embedding并不统一,存在很大差异。因为muzero里面没有相关的loss来控制他俩一样 阅读全文
posted @ 2023-04-12 22:29 initial_h 阅读(37) 评论(0) 推荐(0) 编辑