001_机器学习 - 随笔分类(第2页) - 罗西的思考

[源码解析] TensorFlow 分布式环境(6) --- Master 动态逻辑

摘要：在具体介绍 TensorFlow 分布式的各种 Strategy 之前，我们首先需要看看分布式的基础：分布式环境。只有把基础打扎实了，才能在以后的分析工作之中最大程度的扫清障碍，事半功倍。本文会从 Client 开始，看看 Master 如何对计算图进行处理。阅读全文

posted @ 2022-03-29 16:34 罗西的思考阅读(586) 评论(1) 推荐(2) 编辑

[源码解析] TensorFlow 分布式环境(5) --- Session

摘要：在具体介绍 TensorFlow 分布式的各种 Strategy 之前，我们首先需要看看分布式的基础：分布式环境。只有把基础打扎实了，才能在以后的分析工作之中最大程度的扫清障碍，事半功倍。会话机制是TensorFlow 分布式运行时的核心，我们接下来按照从 Client 到 worker 的流程，把 Session 机制从前到后走一遍。阅读全文

posted @ 2022-03-28 19:49 罗西的思考阅读(862) 评论(1) 推荐(0) 编辑

[源码解析] TensorFlow 分布式环境(4) --- WorkerCache

摘要：在具体介绍 TensorFlow 分布式的各种 Strategy 之前，我们首先需要看看分布式的基础：分布式环境。只有把基础打扎实了，才能在以后的分析工作之中最大程度的扫清障碍，事半功倍。我们接下来介绍缓存机制。阅读全文

posted @ 2022-03-23 19:40 罗西的思考阅读(544) 评论(0) 推荐(0) 编辑

[源码解析] TensorFlow 分布式环境(3)--- Worker 静态逻辑

摘要：在具体介绍 TensorFlow 分布式的各种 Strategy 之前，我们首先需要看看分布式的基础：分布式环境。只有把基础打扎实了，才能在以后的分析工作之中最大程度的扫清障碍，事半功倍。本篇介绍 Worker（一系列相关概念）的静态架构。阅读全文

posted @ 2022-03-21 19:29 罗西的思考阅读(823) 评论(0) 推荐(0) 编辑

[源码解析] TensorFlow 分布式环境(2)---Master 静态逻辑

摘要：在具体介绍 TensorFlow 分布式的各种 Strategy 之前，我们首先需要看看分布式的基础：分布式环境。只有把基础打扎实了，才能在以后的分析工作之中最大程度的扫清障碍，事半功倍。本文梳理下 Master 的静态逻辑。阅读全文

posted @ 2022-03-19 14:56 罗西的思考阅读(1013) 评论(0) 推荐(1) 编辑

[源码解析] TensorFlow 分布式环境(1) --- 总体架构

摘要：在具体介绍 TensorFlow 分布式的各种 Strategy 之前，我们首先需要看看分布式的基础：分布式环境。只有把基础打扎实了，才能在以后的分析工作之中最大程度的扫清障碍，事半功倍。阅读全文

posted @ 2022-03-16 19:33 罗西的思考阅读(2225) 评论(0) 推荐(0) 编辑

[翻译] TensorFlow 分布式之论文篇 "Implementation of Control Flow in TensorFlow"

摘要：读论文有一种原则是：本领域最经典的论文，近5年最热的论文，近1年最新的论文。按照这个原则，本文主要介绍一篇Tensorflow 经典论文 [Implementation of Control Flow in TensorFlow]。阅读全文

posted @ 2022-03-15 17:27 罗西的思考阅读(872) 评论(0) 推荐(0) 编辑

[翻译] TensorFlow 分布式之论文篇 "TensorFlow : Large-Scale Machine Learning on Heterogeneous Distributed Systems"

摘要：本文主要介绍一篇 TensorFlow 经典论文[ TensorFlow : Large-Scale Machine Learning on Heterogeneous Distributed Systems](http://download. TensorFlow .org/paper/whitepaper2015.pdf)。大家如果读了下面论文就会发现 TensorFlow分布式的博大精深。阅读全文

posted @ 2022-03-12 09:31 罗西的思考阅读(1368) 评论(0) 推荐(0) 编辑

[翻译] NVIDIA HugeCTR，GPU 版本参数服务器 --(10)--- 推理架构

摘要：经过9篇文章之后，我们基本把 HugeCTR 的训练过程梳理了以下，现在我们有必要看看HugeCTR如何进行推理，这样可以让我们从整体上有一个更好的把握。而且我们之前都是分析分布式训练，此处恰好可以看看分布式推理。阅读全文

posted @ 2022-03-10 17:24 罗西的思考阅读(905) 评论(0) 推荐(0) 编辑

[源码解析] NVIDIA HugeCTR，GPU 版本参数服务器 --(9)--- Local hash表

摘要：在这个系列中，我们介绍了 HugeCTR，这是一个面向行业的推荐系统训练框架，针对具有模型并行嵌入和数据并行密集网络的大规模 CTR 模型进行了优化。本文介绍 LocalizedSlotSparseEmbeddingHash 的后向操作。阅读全文

posted @ 2022-03-09 20:09 罗西的思考阅读(795) 评论(0) 推荐(0) 编辑

[源码解析] NVIDIA HugeCTR，GPU 版本参数服务器---(8) ---Distributed Hash之后向传播

摘要：在这个系列中，我们介绍了 HugeCTR，这是一个面向行业的推荐系统训练框架，针对具有模型并行嵌入和数据并行密集网络的大规模 CTR 模型进行了优化。本文介绍 DistributedSlotSparseEmbeddingHash 的后向操作。阅读全文

posted @ 2022-03-04 17:31 罗西的思考阅读(705) 评论(0) 推荐(0) 编辑

[源码解析] NVIDIA HugeCTR，GPU 版本参数服务器---(7) ---Distributed Hash之前向传播

摘要：在这系列文章中，我们介绍了 HugeCTR，这是一个面向行业的推荐系统训练框架，针对具有模型并行嵌入和数据并行密集网络的大规模 CTR 模型进行了优化。阅读全文

posted @ 2022-02-28 16:44 罗西的思考阅读(1441) 评论(0) 推荐(0) 编辑

[源码解析] NVIDIA HugeCTR，GPU版本参数服务器--- (6) --- Distributed hash表

摘要：在这系列文章中，我们介绍了 HugeCTR，这是一个面向行业的推荐系统训练框架，针对具有模型并行嵌入和数据并行密集网络的大规模 CTR 模型进行了优化。阅读全文

posted @ 2022-02-23 17:42 罗西的思考阅读(891) 评论(0) 推荐(0) 编辑

[源码解析] NVIDIA HugeCTR，GPU版本参数服务器--- (5) 嵌入式hash表

摘要：在这篇文章中，我们介绍了 HugeCTR，这是一个面向行业的推荐系统训练框架，针对具有模型并行嵌入和数据并行密集网络的大规模 CTR 模型进行了优化。阅读全文

posted @ 2022-02-22 18:09 罗西的思考阅读(994) 评论(0) 推荐(0) 编辑

[源码解析] NVIDIA HugeCTR，GPU版本参数服务器--- (4)

摘要：在这个系列中，我们介绍了 HugeCTR，这是一个面向行业的推荐系统训练框架，针对具有模型并行嵌入和数据并行密集网络的大规模 CTR 模型进行了优化。阅读全文

posted @ 2022-02-21 19:36 罗西的思考阅读(690) 评论(0) 推荐(0) 编辑

[源码解析] NVIDIA HugeCTR，GPU版本参数服务器---(3)

摘要：在本系列中，我们介绍了 HugeCTR，这是一个面向行业的推荐系统训练框架，针对具有模型并行嵌入和数据并行密集网络的大规模 CTR 模型进行了优化。阅读全文

posted @ 2022-02-17 17:40 罗西的思考阅读(815) 评论(0) 推荐(0) 编辑

[源码解析] NVIDIA HugeCTR，GPU版本参数服务器--- (2)

摘要：在这篇文章中，我们介绍了 HugeCTR，这是一个面向行业的推荐系统训练框架，针对具有模型并行嵌入和数据并行密集网络的大规模 CTR 模型进行了优化。阅读全文

posted @ 2022-02-16 20:04 罗西的思考阅读(1140) 评论(0) 推荐(1) 编辑

[源码解析] NVIDIA HugeCTR，GPU 版本参数服务器 --(1)

摘要：本系列之中我们将会介绍 NVIDIA 出品的 HugeCTR，这是一个面向行业的推荐系统训练框架，针对具有模型并行嵌入和数据并行密集网络的大规模 CTR 模型进行了优化。阅读全文

posted @ 2022-02-15 19:29 罗西的思考阅读(2720) 评论(2) 推荐(0) 编辑

[源码解析] 模型并行分布式训练Megatron (5) --Pipedream Flush

摘要：NVIDIA Megatron 是一个基于 PyTorch 的分布式训练框架，用来训练超大Transformer语言模型，其通过综合应用了数据并行，Tensor并行和Pipeline并行来复现 GPT3，值得我们深入分析其背后机理。阅读全文

posted @ 2022-02-14 17:31 罗西的思考阅读(6137) 评论(3) 推荐(0) 编辑

[源码解析] 模型并行分布式训练 Megatron (4) --- 如何设置各种并行

摘要：NVIDIA Megatron 是一个基于 PyTorch 的分布式训练框架，用来训练超大Transformer语言模型，其通过综合应用了数据并行，Tensor并行和Pipeline并行来复现 GPT3，值得我们深入分析其背后机理。阅读全文

posted @ 2022-02-10 18:42 罗西的思考阅读(8049) 评论(0) 推荐(2) 编辑

随笔分类 - 001_机器学习

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论