02 2024 档案

摘要：modelscope大模型下载阅读全文

posted @ 2024-02-29 13:57 岁阅读(194) 评论(0) 推荐(0) 编辑

摘要：用于图片内容识别 https://www.kaggle.com/datasets/williamscott701/memotion-dataset-7k https://huggingface.co/datasets/sizhkhy/passports https://huggingface.co/ 阅读全文

posted @ 2024-02-28 13:52 岁阅读(83) 评论(0) 推荐(0) 编辑

远程GPU服务器环境配置

摘要：GPU服务器环境深度学习、大模型环境搭建、miniconda 阅读全文

posted @ 2024-02-27 14:39 岁阅读(208) 评论(0) 推荐(0) 编辑

Swift大模型微调以及批量推理验证

摘要：大语言模型，多模态大模型微调，qwen-vl，yi-vl-34b，qwen1.5，Swift框架阅读全文

posted @ 2024-02-27 11:29 岁阅读(4235) 评论(1) 推荐(1) 编辑

多模态大模型总结

摘要：Gemini、QWEN-VL、Yi-VL等模型都是多模态大模型，其中Gemini是闭源的，Pro 和 Max 版本需要微调；QWEN-VL是开源的，Pro 和 Max 版本需要微调，下一步测试效果；ChatGLM有Vision版本，但GLM4已经闭源；GPT4-Vision-Preview版本图片理解能力较强，测试了少量样本，基本满足业务需求。Yi-VL-34B开源并支持Swift微调。阅读全文

posted @ 2024-02-23 18:40 岁阅读(2779) 评论(1) 推荐(0) 编辑

公告

昵称：岁
园龄： 4年1个月
粉丝： 10
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

岁

02 2024 档案

公告

搜索

常用链接

最新随笔

我的标签

积分与排名

随笔分类

随笔档案

阅读排行榜

推荐排行榜

最新评论