摘要: 微调 Florence-2 - 微软的尖端视觉语言模型 Florence-2 是微软于 2024 年 6 月发布的一个基础视觉语言模型。该模型极具吸引力,因为它尺寸很小 (0.2B 及 0.7B) 且在各种计算机视觉和视觉语言任务上表现出色。 Florence 开箱即用支持多种类型的任务,包括: 看图说话、目标检测、OCR 等等。虽然覆盖面很广,但仍有可 阅读全文
posted @ 2024-07-15 19:17 HuggingFace 阅读(258) 评论(0) 推荐(0) 编辑