会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
是小叶呀
博客园
首页
新随笔
联系
订阅
管理
2022年3月26日
数据并行、模型并行、流水线并行
摘要: 一、数据并行(DP ) 1、概念:相同的模型分布在不同的GPU上,在不同的GPU上使用不同的数据。每一张GPU上有相同的参数,在训练的时候每一个GPU训练不同的数据,相当于增大了训练时候的batch_size。 数据并行基于一个假设:所有节点都可以放下整个模型。这个假设在某些模型上(如GPT3)是不
阅读全文
posted @ 2022-03-26 20:40 NLP的小Y
阅读(6443)
评论(0)
推荐(0)
编辑
公告
/*粒子线条,鼠标移动会以鼠标为中心吸附的特效*/