2023 年 12月 16 日随笔档案 - Eirrac

2023年12月16日

Instruction-Following Agents with Multimodal Transformer

摘要：概述提出了InstructRL，包含一个multimodal transformer用来将视觉obs和语言的instruction进行编码，以及一个transformer-based policy，可以基于编码的表示来输出actions。前者在1M的image-text对和NL的text上进行训阅读全文

posted @ 2023-12-16 17:01 Eirrac 阅读(48) 评论(0) 推荐(0) 编辑

Eirrac Note

公告