摘要: Horovod是一个支持TensorFlow、Keras、PyTorch和Apache MXNet的分布式训练框架。Horovod的目标是让分布式深度学习更快更易用。 为啥不用原生的TensorFlow分布式训练? 1、代码改动多少? 2、比原生的分布式训练快多少? Horovod用的MPI比分布式 阅读全文
posted @ 2019-09-06 19:00 happyyoung 阅读(2673) 评论(0) 推荐(0) 编辑
摘要: 参考链接 https://github.com/kubeflow/kubeflow https://www.kubeflow.org/docs/started/getting-started/ 阅读全文
posted @ 2019-09-06 16:58 happyyoung 阅读(287) 评论(0) 推荐(0) 编辑