会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
笨鸟居士的博客
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
41
42
43
44
45
46
47
48
49
···
293
下一页
2026年1月15日
因果推断的一些内容
该文被密码保护。
阅读全文
posted @ 2026-01-15 14:57 blcblc
阅读(0)
评论(0)
推荐(0)
2026年1月14日
微调Qwen-Image参考这些资料试一试吧
摘要: https://blog.csdn.net/Liudef06/article/details/149983203 深度定制视觉生成:Qwen-Image模型微调完全指南 https://github.com/tsiendragon/qwen-image-finetune https://www.mo
阅读全文
posted @ 2026-01-14 23:12 blcblc
阅读(24)
评论(0)
推荐(0)
qwen3的transformer的几种写法
该文被密码保护。
阅读全文
posted @ 2026-01-14 22:39 blcblc
阅读(0)
评论(0)
推荐(0)
LLaMA-Factory试试这个吧
摘要: https://zhuanlan.zhihu.com/p/695287607 LLaMA-Factory QuickStart 另外参考这些: https://github.com/hiyouga/LlamaFactory/blob/main/examples/README.md#qlora-fin
阅读全文
posted @ 2026-01-14 20:14 blcblc
阅读(7)
评论(0)
推荐(0)
zzKaggle竞赛夺冠秘籍:用Llama-Factory快速迭代NLP模型
摘要: https://blog.csdn.net/weixin_42234168/article/details/155865298 Kaggle竞赛夺冠秘籍:用Llama-Factory快速迭代NLP模型 1. LoRA目标层的选择有讲究不要盲目对所有线性层应用LoRA。经验表明,在注意力机制中仅作用于
阅读全文
posted @ 2026-01-14 16:06 blcblc
阅读(1)
评论(0)
推荐(0)
zz仔仔细细的学这些finetune的内容
该文被密码保护。
阅读全文
posted @ 2026-01-14 14:41 blcblc
阅读(0)
评论(0)
推荐(0)
Qwen-VL vs. Omni
摘要: https://zhuanlan.zhihu.com/p/1955226799605814115 规模与定位的博弈 — 为什么 Qwen 的 VL 系列远比 Omni 更“大”?
阅读全文
posted @ 2026-01-14 12:50 blcblc
阅读(11)
评论(0)
推荐(0)
zz 解读Grounding DINO-根据文字提示检测任意目标
摘要: https://zhuanlan.zhihu.com/p/627646794 十分钟解读Grounding DINO-根据文字提示检测任意目标
阅读全文
posted @ 2026-01-14 12:43 blcblc
阅读(9)
评论(0)
推荐(0)
zz超大规模训练手册:在GPU集群上训练大规模语言模型
摘要: https://zhuanlan.zhihu.com/p/26640798659 Huggingface发布《超大规模训练手册:在GPU集群上训练大规模语言模型》,大模型训练的宝藏手册
阅读全文
posted @ 2026-01-14 12:29 blcblc
阅读(5)
评论(0)
推荐(0)
zzQwen3-VL技术报告,还有3篇代码分析要看
摘要: https://zhuanlan.zhihu.com/p/1981497299956946050 Qwen3-VL技术报告解析 https://zhuanlan.zhihu.com/p/1956306982970586546 【多模态大模型】Qwen3-VL解剖 https://zhuanlan.z
阅读全文
posted @ 2026-01-14 12:22 blcblc
阅读(24)
评论(0)
推荐(0)
上一页
1
···
41
42
43
44
45
46
47
48
49
···
293
下一页
公告