Pytorch 非cuda0 多gpu 训练

python -m torch.distributed.launch --nproc_per_node 2 train.py --ba
tch 16 --data coco.yaml --weights yolov5l.pt --device 4,5

https://github.com/ultralytics/yolov5/issues/475

python -m torch.distributed.launch --nproc_per_node 2 --master_port=8177 train.py --img 960 --batch 16 --data coco.yaml --weights yolov5l.pt --name 960-large-16

（--master_port=8177 可以解决RuntimeError: Address already in use问题）

注意：--master_port=RANDOM写在train.py之前（分布训练的参数需要和train.py 以及训练相关的参数分开）

posted @ 2022-02-21 15:12 ZXYFrank 阅读(113) 评论(0) 收藏举报

刷新页面返回顶部

Loading

ZXYFrank

Enjoy the process🍀

Pytorch 非cuda0 多gpu 训练

公告