会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
笨鸟居士的博客
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
42
43
44
45
46
47
48
49
50
···
293
下一页
2026年1月14日
zzQwen3-VL技术报告,还有3篇代码分析要看
摘要: https://zhuanlan.zhihu.com/p/1981497299956946050 Qwen3-VL技术报告解析 https://zhuanlan.zhihu.com/p/1956306982970586546 【多模态大模型】Qwen3-VL解剖 https://zhuanlan.z
阅读全文
posted @ 2026-01-14 12:22 blcblc
阅读(25)
评论(0)
推荐(0)
2026年1月13日
zz试一下这个视觉注意力的代码
该文被密码保护。
阅读全文
posted @ 2026-01-13 22:29 blcblc
阅读(0)
评论(0)
推荐(0)
zz大模型训练中的loss激增问题(loss spike、logits drift)
摘要: https://zhuanlan.zhihu.com/p/10927658580 大模型训练中的loss激增问题(loss spike、logits drift)
阅读全文
posted @ 2026-01-13 22:04 blcblc
阅读(10)
评论(0)
推荐(0)
跟进这本书的进展吧
该文被密码保护。
阅读全文
posted @ 2026-01-13 21:28 blcblc
阅读(0)
评论(0)
推荐(0)
几个CLIP和VLLM的网站,之后再看
该文被密码保护。
阅读全文
posted @ 2026-01-13 19:48 blcblc
阅读(0)
评论(0)
推荐(0)
zz从 LLaVA 到 Qwen3-VL,解构多模态大模型的演进之路
摘要: https://zhuanlan.zhihu.com/p/1963658684765833212 多模态大模型主流架构介绍:从 LLaVA 到 Qwen3-VL,解构多模态大模型的演进之路
阅读全文
posted @ 2026-01-13 18:59 blcblc
阅读(8)
评论(0)
推荐(0)
LLaVA系列
该文被密码保护。
阅读全文
posted @ 2026-01-13 17:42 blcblc
阅读(0)
评论(0)
推荐(0)
zz FlashAttention V1 V2
该文被密码保护。
阅读全文
posted @ 2026-01-13 17:40 blcblc
阅读(0)
评论(0)
推荐(0)
zz 对 softmax 和 cross-entropy 求导
该文被密码保护。
阅读全文
posted @ 2026-01-13 16:58 blcblc
阅读(0)
评论(0)
推荐(0)
zz这个推理加速系列可以看看
该文被密码保护。
阅读全文
posted @ 2026-01-13 15:39 blcblc
阅读(0)
评论(0)
推荐(0)
上一页
1
···
42
43
44
45
46
47
48
49
50
···
293
下一页
公告