会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
笨鸟居士的博客
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
44
45
46
47
48
49
50
51
52
···
293
下一页
2026年1月13日
讲的跟屎一样 RoPE Rotary Position Embedding编码
该文被密码保护。
阅读全文
posted @ 2026-01-13 01:15 blcblc
阅读(2)
评论(0)
推荐(0)
zz看几个系列吧,多模态llava和vllm
该文被密码保护。
阅读全文
posted @ 2026-01-13 00:09 blcblc
阅读(0)
评论(0)
推荐(0)
2026年1月12日
zz一些量化的文章,一般
摘要: https://zhuanlan.zhihu.com/p/627436535 LLM(11):大语言模型的模型量化(INT8/INT4)技术 https://mp.weixin.qq.com/s/rd9d5RLvvs_bFgq9VI6RqQ 大规模 Transformer 模型 8 比特矩阵乘简介
阅读全文
posted @ 2026-01-12 23:03 blcblc
阅读(7)
评论(0)
推荐(0)
zzFlashAttention:加速计算,节省显存, IO感知的精确注意力
该文被密码保护。
阅读全文
posted @ 2026-01-12 19:42 blcblc
阅读(0)
评论(0)
推荐(0)
zz文生图模型之Stable Diffusion
该文被密码保护。
阅读全文
posted @ 2026-01-12 17:26 blcblc
阅读(0)
评论(0)
推荐(0)
zz实验了一个reshape的操作,不错
该文被密码保护。
阅读全文
posted @ 2026-01-12 17:17 blcblc
阅读(0)
评论(0)
推荐(0)
DPO的一个例子zz
该文被密码保护。
阅读全文
posted @ 2026-01-12 14:48 blcblc
阅读(0)
评论(0)
推荐(0)
NVIDIA A10 与 A100 GPU 对比分析:用于LLM 和Stable Diffusion推理zz
摘要: https://www.jaeaiot.com/news/detail/295.html NVIDIA A10 与 A100 GPU 对比分析:用于LLM 和Stable Diffusion推理
阅读全文
posted @ 2026-01-12 14:17 blcblc
阅读(8)
评论(0)
推荐(0)
激活重计算(Activation Recomputation)
摘要: https://www.zhihu.com/search?type=content&q=%E6%BF%80%E6%B4%BB%E9%87%8D%E8%AE%A1%E7%AE%97 激活重计算(Activation Recomputation)
阅读全文
posted @ 2026-01-12 11:02 blcblc
阅读(6)
评论(0)
推荐(0)
2026年1月11日
zz分析transformer模型的参数量、计算量、中间激活、KV cache
该文被密码保护。
阅读全文
posted @ 2026-01-11 01:04 blcblc
阅读(4)
评论(0)
推荐(0)
上一页
1
···
44
45
46
47
48
49
50
51
52
···
293
下一页
公告