会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
AudreyXu
博客园
首页
新随笔
联系
订阅
管理
2023年3月16日
大规模分布式训练经验
摘要: 一、单机单卡训练 1. 基本概念 芯片的内存 模型训练时的内存主要消耗在: 神经元的中间值 参数值(包括权重、梯度值和优化器的状态值) 2. 优化方法 单卡速度主要由单块AI加速芯片的运算速度、数据IO来决定。 优化方法:可以用激活重计算这个方法来进行优化。 具体操作为: 在网络中标记少量的算子 ,
阅读全文
posted @ 2023-03-16 19:52 地球美好不
阅读(129)
评论(0)
推荐(0)
编辑
公告