Loading

摘要: 多模态大模型概述-大语言模型6 想了很久,最后还是写了这篇。 LLaVA 贡献 多模态指令数据。当下关键的挑战之一是缺乏视觉与语言组成的指令数据。本文提出了一个数据重组方式,使用 ChatGPT/GPT-4 将图像 - 文本对转换为适当的指令格式; 大型多模态模型。研究者通过连接 CLIP 的开源视 阅读全文
posted @ 2024-04-27 21:34 vanilla阿草 阅读(296) 评论(0) 推荐(0) 编辑