mmdetection指令记录

Train指令

 1. 多机分布式训练命令,假设有两台机器(参考Pytorch 分布式训练 - 知乎 (zhihu.com)[原创][深度][PyTorch] DDP系列第一篇:入门教程 - 知乎 (zhihu.com)

# master机器,address是192.168.1.201,node_rank必须设置为0
python -m torch.distributed.launch --nproc_per_node=2 --nnodes=2 --node_rank=0 --master_addr="192.168.1.201" --master_port=23456 env_init.py
# labor机器
python -m torch.distributed.launch --nproc_per_node=2 --nnodes=2 --node_rank=1 --master_addr="192.168.1.201" --master_port=23456 main.py

Test指令

1. 储存json格式结果文件,用于evaluation server或者错误分析。最终结果储存在json_file.bbox.json和json_file.segm.json。

CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 ./tools/dist_test.sh [configs_file] [network_weight_file] 8 --format-only --options "jsonfile_prefix=[json_file]"

2. COCO数据集分析错误模式,错误模式分析图像储存在result_dir中。

python tools/coco_error_analysis.py [json_file] [result_dir]  --ann=data/coco/annotations/instances_val2017.json --types=['segm'/'bbox']

 

posted @ 2021-03-22 13:46  TinaSmile  阅读(16)  评论(0编辑  收藏  举报