mmdetection指令记录
Train指令
1. 多机分布式训练命令,假设有两台机器(参考Pytorch 分布式训练 - 知乎 (zhihu.com),[原创][深度][PyTorch] DDP系列第一篇:入门教程 - 知乎 (zhihu.com))
# master机器,address是192.168.1.201,node_rank必须设置为0 python -m torch.distributed.launch --nproc_per_node=2 --nnodes=2 --node_rank=0 --master_addr="192.168.1.201" --master_port=23456 env_init.py # labor机器 python -m torch.distributed.launch --nproc_per_node=2 --nnodes=2 --node_rank=1 --master_addr="192.168.1.201" --master_port=23456 main.py
Test指令
1. 储存json格式结果文件,用于evaluation server或者错误分析。最终结果储存在json_file.bbox.json和json_file.segm.json。
CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 ./tools/dist_test.sh [configs_file] [network_weight_file] 8 --format-only --options "jsonfile_prefix=[json_file]"
2. COCO数据集分析错误模式,错误模式分析图像储存在result_dir中。
python tools/coco_error_analysis.py [json_file] [result_dir] --ann=data/coco/annotations/instances_val2017.json --types=['segm'/'bbox']