会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Loading
SunStriKE's Blog
博客园
首页
新随笔
联系
订阅
管理
合集-分布式训练
LLM并行训练1-流水线并行
摘要:流水线并行相关原理的学习笔记
阅读全文
posted @
2024-06-26 22:06
SunStriKE
阅读(1502)
评论(0)
推荐(1)
LLM并行训练2-张量并行
摘要:张量并行相关原理的学习笔记
阅读全文
posted @
2024-06-27 17:22
SunStriKE
阅读(645)
评论(0)
推荐(0)
LLM并行训练3-数据并行
摘要:大模型训练 数据并行相关的学习笔记, 主要内容 zero, zero++
阅读全文
posted @
2024-06-28 22:25
SunStriKE
阅读(838)
评论(0)
推荐(0)
LLM并行训练4-megascale论文学习
摘要:字节megascale论文学习笔记
阅读全文
posted @
2024-06-29 18:27
SunStriKE
阅读(571)
评论(0)
推荐(1)
LLM并行训练5-MoE并行
摘要:LLM并行训练-moe并行学习笔记
阅读全文
posted @
2024-07-20 12:48
SunStriKE
阅读(2989)
评论(0)
推荐(0)
LLM并行训练6-激活优化
摘要:LLM训练activation优化相关技术, 包括激活重计算/序列并行/zero-R/zero-offload等
阅读全文
posted @
2024-07-20 21:10
SunStriKE
阅读(884)
评论(2)
推荐(0)
LLM并行训练7-混合并行总结
摘要:LLM并行训练-总结: 如何调整混合并行策略和nvidia训练GPT3的分析
阅读全文
posted @
2024-07-29 21:29
SunStriKE
阅读(1564)
评论(0)
推荐(0)
deepseek-v3 论文阅读
摘要:deepseek-v3论文中 AIInfra相关的技术学习
阅读全文
posted @
2025-02-12 21:15
SunStriKE
阅读(1556)
评论(0)
推荐(0)
公告