摘要: Facebook 和英特尔合作改善了第三代英特尔® 至强® 可扩展处理器上的 PyTorch 性能。 利用英特尔® 深度学习加速的新 bfloat16 功能,该团队能够在多种培训工作负载下显着提高 PyTorch 性能与 FP32 相比,将代表性计算机视觉模型的培训性能提高了 1.64 倍,将 DLRM 模型的培训性能提高了 1.40 倍,并且 DLRM 模型的 INT8 推理性能是 FP32 的 2.85 倍。 阅读全文
posted @ 2020-11-12 09:38 示说网 阅读(716) 评论(0) 推荐(0) 编辑