2019 年 9月 26 日随笔档案 - walter_xh

2019年9月26日

摘要：概述 Pytorch多GPU训练本质上是数据并行，每个GPU上拥有整个模型的参数，将一个batch的数据均分成N份，每个GPU处理一份数据，然后将每个GPU上的梯度进行整合得到整个batch的梯度，用整合后的梯度更新所有GPU上的参数，完成一次迭代。其中多gpu训练的方案有两种，一种是利用实现，阅读全文

posted @ 2019-09-26 12:28 walter_xh 阅读(21590) 评论(14) 推荐(3) 编辑

walter_xh

公告