摘要: 使用机器生成的指令跟踪数据对大型语言模型 (LLM) 进行指令调整已被证明可以提高新任务的零样本能力,但这个想法在多模态领域的探索较少。我们首次尝试使用纯语言 GPT-4 生成多模态语言图像指令跟踪数据。通过对此类生成的数据进行指令调整,我们引入了 LLaVA:大型语言和视觉助手,这是一个端到端训练 阅读全文
posted @ 2024-09-24 16:36 周树皮KysonZhou 阅读(72) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示