Loading

摘要: 将深度学习模型的训练从单GPU扩展到多GPU主要面临以下问题:(1)训练框架必须支持GPU间的通信,(2)用户必须更改大量代码以使用多GPU进行训练。为了克服这些问题,本文提出了Horovod,它通过Ring Allreduce实现高效的GPU间通信,而且仅仅更改少量代码就可以实现多GPU训练。 T 阅读全文
posted @ 2020-03-28 11:57 shuo-ouyang 阅读(541) 评论(0) 推荐(0) 编辑
摘要: MXNet是一个支持多种编程语言的机器学习库,使用MXNet可以方便地实现机器学习算法,尤其是深度神经网络。通过嵌入在宿主语言中,它将声明式符号表达与命令式张量计算相结合。它提供自动求导以计算梯度。MXNet具有高效的计算和存储操作,可运行在从移动设备到分布式GPU集群的各种异构系统上。MXNet的 阅读全文
posted @ 2020-03-28 11:53 shuo-ouyang 阅读(302) 评论(0) 推荐(0) 编辑