Loading

Pytorch 非cuda0 多gpu 训练

python -m torch.distributed.launch --nproc_per_node 2 train.py --ba
tch 16 --data coco.yaml --weights yolov5l.pt --device 4,5

https://github.com/ultralytics/yolov5/issues/475

python -m torch.distributed.launch --nproc_per_node 2 --master_port=8177 train.py --img 960 --batch 16 --data coco.yaml --weights yolov5l.pt --name 960-large-16 

(--master_port=8177 可以解决RuntimeError: Address already in use问题)

注意:--master_port=RANDOM写在train.py之前(分布训练的参数需要和train.py 以及训练相关的参数分开)

posted @ 2022-02-21 15:12  ZXYFrank  阅读(69)  评论(0编辑  收藏  举报