摘要: 概述 提出了InstructRL,包含一个multimodal transformer用来将视觉obs和语言的instruction进行编码,以及一个transformer-based policy,可以基于编码的表示来输出actions。 前者在1M的image-text对和NL的text上进行训 阅读全文
posted @ 2023-12-16 17:01 Eirrac 阅读(48) 评论(0) 推荐(0) 编辑