摘要: https://horovod.readthedocs.io/en/stable/docker.html Step1 构建镜像 GPU $ mkdir horovod-docker-gpu $ wget -O horovod-docker-gpu/Dockerfile https://raw.git 阅读全文
posted @ 2020-07-28 14:41 sixinshuier 阅读(771) 评论(2) 推荐(0) 编辑
摘要: Usage 代码中要包含以下6步: 初始化 Run hvd.init() to initialize Horovod. 将每个GPU固定到单个进程以避免资源争用。 一个线程一个GPU,设置到 local rank ,第一个线程将分配给第一个GPU。第二个线程将分配给第二个GPU 向每个 Tensor 阅读全文
posted @ 2020-07-28 14:39 sixinshuier 阅读(105) 评论(0) 推荐(0) 编辑
摘要: Horovod documentation 安装 【Step1】安装Open MPI 注意: Open MPI 3.1.3 安装有些问题, 可以安装 Open MPI 3.1.2 或者 Open MPI 4.0.0. 【Step2】安装 TensorFlow pip install tensorfl 阅读全文
posted @ 2020-07-28 14:38 sixinshuier 阅读(802) 评论(0) 推荐(0) 编辑
摘要: Run Horovod https://horovod.readthedocs.io/en/stable/running_include.html https://horovod.readthedocs.io/en/stable/running.html horovodrun训练,通过-np 指定线 阅读全文
posted @ 2020-07-28 14:35 sixinshuier 阅读(380) 评论(0) 推荐(0) 编辑