摘要: Gemini、QWEN-VL、Yi-VL等模型都是多模态大模型,其中Gemini是闭源的,Pro 和 Max 版本需要微调;QWEN-VL是开源的,Pro 和 Max 版本需要微调,下一步测试效果;ChatGLM有Vision版本,但GLM4已经闭源;GPT4-Vision-Preview版本图片理解能力较强,测试了少量样本,基本满足业务需求。Yi-VL-34B开源并支持Swift微调。 阅读全文
posted @ 2024-02-23 18:40 岁 阅读(2016) 评论(1) 推荐(0) 编辑