摘要: We also use a smaller mini-batch size of 256 without any noticeable performance degradation. This is in contrast to CURL and DrQ that both use a large 阅读全文
posted @ 2022-08-11 18:53 呦呦南山 阅读(38) 评论(0) 推荐(0) 编辑
摘要: 在drqv2中,从环境中得到image-based观测obs,之后经过aug,生成aug之后的obs,之后再输入encoder网络,再输入2个critic和actor网络。 这里注意: 与drqv中把encoder与critic和actor相结合不同,drqv-2则是把encoder单独列为上游网络 阅读全文
posted @ 2022-08-11 18:26 呦呦南山 阅读(253) 评论(0) 推荐(0) 编辑