02 2024 档案
摘要:用于图片内容识别 https://www.kaggle.com/datasets/williamscott701/memotion-dataset-7k https://huggingface.co/datasets/sizhkhy/passports https://huggingface.co/
阅读全文
摘要:GPU服务器环境深度学习、大模型环境搭建、miniconda
阅读全文
摘要:大语言模型,多模态大模型微调,qwen-vl,yi-vl-34b,qwen1.5,Swift框架
阅读全文
摘要:Gemini、QWEN-VL、Yi-VL等模型都是多模态大模型,其中Gemini是闭源的,Pro 和 Max 版本需要微调;QWEN-VL是开源的,Pro 和 Max 版本需要微调,下一步测试效果;ChatGLM有Vision版本,但GLM4已经闭源;GPT4-Vision-Preview版本图片理解能力较强,测试了少量样本,基本满足业务需求。Yi-VL-34B开源并支持Swift微调。
阅读全文