摘要:
Horovod是一个支持TensorFlow、Keras、PyTorch和Apache MXNet的分布式训练框架。Horovod的目标是让分布式深度学习更快更易用。 为啥不用原生的TensorFlow分布式训练? 1、代码改动多少? 2、比原生的分布式训练快多少? Horovod用的MPI比分布式 阅读全文
摘要:
参考链接 https://github.com/kubeflow/kubeflow https://www.kubeflow.org/docs/started/getting-started/ 阅读全文