2024 年 4月 27 日随笔档案 - vanilla阿草

2024年4月27日

摘要：多模态大模型概述-大语言模型6 想了很久，最后还是写了这篇。 LLaVA 贡献多模态指令数据。当下关键的挑战之一是缺乏视觉与语言组成的指令数据。本文提出了一个数据重组方式，使用 ChatGPT/GPT-4 将图像 - 文本对转换为适当的指令格式；大型多模态模型。研究者通过连接 CLIP 的开源视阅读全文

posted @ 2024-04-27 21:34 vanilla阿草阅读(358) 评论(0) 推荐(0) 编辑

Loading

vanilla

公告