blcblc - 博客园

2026年1月15日

该文被密码保护。阅读全文

posted @ 2026-01-15 14:57 blcblc 阅读(1) 评论(0) 推荐(0)

2026年1月14日

摘要： https://blog.csdn.net/Liudef06/article/details/149983203 深度定制视觉生成：Qwen-Image模型微调完全指南 https://github.com/tsiendragon/qwen-image-finetune https://www.mo 阅读全文

posted @ 2026-01-14 23:12 blcblc 阅读(24) 评论(0) 推荐(0)

qwen3的transformer的几种写法

该文被密码保护。阅读全文

posted @ 2026-01-14 22:39 blcblc 阅读(0) 评论(0) 推荐(0)

LLaMA-Factory试试这个吧

摘要： https://zhuanlan.zhihu.com/p/695287607 LLaMA-Factory QuickStart 另外参考这些： https://github.com/hiyouga/LlamaFactory/blob/main/examples/README.md#qlora-fin 阅读全文

posted @ 2026-01-14 20:14 blcblc 阅读(7) 评论(0) 推荐(0)

zzKaggle竞赛夺冠秘籍：用Llama-Factory快速迭代NLP模型

摘要： https://blog.csdn.net/weixin_42234168/article/details/155865298 Kaggle竞赛夺冠秘籍：用Llama-Factory快速迭代NLP模型 1. LoRA目标层的选择有讲究不要盲目对所有线性层应用LoRA。经验表明，在注意力机制中仅作用于阅读全文

posted @ 2026-01-14 16:06 blcblc 阅读(1) 评论(0) 推荐(0)

zz仔仔细细的学这些finetune的内容

该文被密码保护。阅读全文

posted @ 2026-01-14 14:41 blcblc 阅读(0) 评论(0) 推荐(0)

Qwen-VL vs. Omni

摘要： https://zhuanlan.zhihu.com/p/1955226799605814115 规模与定位的博弈 — 为什么 Qwen 的 VL 系列远比 Omni 更“大”？阅读全文

posted @ 2026-01-14 12:50 blcblc 阅读(11) 评论(0) 推荐(0)

zz 解读Grounding DINO-根据文字提示检测任意目标

摘要： https://zhuanlan.zhihu.com/p/627646794 十分钟解读Grounding DINO-根据文字提示检测任意目标阅读全文

posted @ 2026-01-14 12:43 blcblc 阅读(9) 评论(0) 推荐(0)

zz超大规模训练手册：在GPU集群上训练大规模语言模型

摘要： https://zhuanlan.zhihu.com/p/26640798659 Huggingface发布《超大规模训练手册：在GPU集群上训练大规模语言模型》，大模型训练的宝藏手册阅读全文

posted @ 2026-01-14 12:29 blcblc 阅读(5) 评论(0) 推荐(0)

zzQwen3-VL技术报告，还有3篇代码分析要看

摘要： https://zhuanlan.zhihu.com/p/1981497299956946050 Qwen3-VL技术报告解析 https://zhuanlan.zhihu.com/p/1956306982970586546 【多模态大模型】Qwen3-VL解剖 https://zhuanlan.z 阅读全文

posted @ 2026-01-14 12:22 blcblc 阅读(24) 评论(0) 推荐(0)

笨鸟居士的博客

公告