Pytorch 非cuda0 多gpu 训练
python -m torch.distributed.launch --nproc_per_node 2 train.py --ba
tch 16 --data coco.yaml --weights yolov5l.pt --device 4,5
https://github.com/ultralytics/yolov5/issues/475
python -m torch.distributed.launch --nproc_per_node 2 --master_port=8177 train.py --img 960 --batch 16 --data coco.yaml --weights yolov5l.pt --name 960-large-16
(--master_port=8177 可以解决RuntimeError: Address already in use问题)
注意:--master_port=RANDOM写在train.py
之前(分布训练的参数需要和train.py 以及训练相关的参数分开)
本博文本意在于记录个人的思考与经验,部分博文采用英语写作,可能影响可读性,请见谅
本文来自博客园,作者:ZXYFrank,转载请注明原文链接:https://www.cnblogs.com/zxyfrank/p/15919005.html