分布式训练 - 随笔分类 - SunStriKE

triton 简要学习笔记

摘要：对triton中的基本语法和cuda进行对照学习阅读全文

posted @ 2025-02-21 21:04 SunStriKE 阅读(745) 评论(0) 推荐(0)

deepseek-v3 论文阅读

摘要：deepseek-v3论文中 AIInfra相关的技术学习阅读全文

posted @ 2025-02-12 21:15 SunStriKE 阅读(1582) 评论(0) 推荐(0)

[megatron代码阅读] 2. TP和PP实现

摘要：megatron 源码阅读第二篇, 看了TP和PP的对应实现阅读全文

posted @ 2025-02-06 20:28 SunStriKE 阅读(1164) 评论(0) 推荐(0)

[megatron代码阅读] 1. 初始化和组网

摘要：以pretrain_gpt.py为例, 看megatron的整体逻辑. 本章主要包括megatron初始化相关逻辑, 核心函数为initialize_megatron, setup_model_and_optimizer两个 initialize_megatron parse_args 从argpa 阅读全文

posted @ 2025-01-13 16:15 SunStriKE 阅读(916) 评论(0) 推荐(0)

LLM并行训练7-混合并行总结

摘要：LLM并行训练-总结: 如何调整混合并行策略和nvidia训练GPT3的分析阅读全文

posted @ 2024-07-29 21:29 SunStriKE 阅读(1603) 评论(0) 推荐(0)

LLM并行训练6-激活优化

摘要：LLM训练activation优化相关技术, 包括激活重计算/序列并行/zero-R/zero-offload等阅读全文

posted @ 2024-07-20 21:10 SunStriKE 阅读(970) 评论(2) 推荐(0)

LLM并行训练5-MoE并行

摘要：LLM并行训练-moe并行学习笔记阅读全文

posted @ 2024-07-20 12:48 SunStriKE 阅读(3073) 评论(0) 推荐(0)

LLM并行训练4-megascale论文学习

摘要：字节megascale论文学习笔记阅读全文

posted @ 2024-06-29 18:27 SunStriKE 阅读(579) 评论(0) 推荐(1)

LLM并行训练3-数据并行

摘要：大模型训练数据并行相关的学习笔记, 主要内容 zero, zero++ 阅读全文

posted @ 2024-06-28 22:25 SunStriKE 阅读(874) 评论(0) 推荐(0)

LLM并行训练2-张量并行

摘要：张量并行相关原理的学习笔记阅读全文

posted @ 2024-06-27 17:22 SunStriKE 阅读(666) 评论(0) 推荐(0)

LLM并行训练1-流水线并行

摘要：流水线并行相关原理的学习笔记阅读全文

posted @ 2024-06-26 22:06 SunStriKE 阅读(1544) 评论(0) 推荐(1)

Loading

SunStriKE's Blog

随笔分类 - 分布式训练

公告