摘要: 本文是对于近年来一些多模态大模型工作的相关总结,重点是这些模型的演化路线,各自做了什么改进。 CLIP 论文链接:https://arxiv.org/abs/2103.00020 以往的图像模型都是采用有监督的预训练,需要在人工标注的数据集上进行学习,这限制了图像模型预训练的数据规模。 CLIP采用 阅读全文
posted @ 2024-03-14 00:16 InunI 阅读(352) 评论(0) 推荐(0) 编辑