摘要: PaliGemma 正式发布 — Google 最新发布的前沿开放视觉语言模型 PaliGemma 是 Google 推出的新一代视觉语言模型家族,能够接收图像与文本输入并生成文本输出。 Google 团队已推出三种类型的模型:预训练(PT)模型、混合模型和微调(FT)模型,这些模型分辨率各异,提供多种精度以便使用。 所有模型均在 Hugging Face Hub 的模型库中发 阅读全文
posted @ 2024-05-18 11:04 HuggingFace 阅读(1267) 评论(0) 推荐(1) 编辑