yolox
论文:《YOLOX: Exceeding YOLO Series in 2021》,CVPR
整体框架
yolox官方的标准测试结果
在本文复现的是yolox-s的版本
下图是YOLOX-L
网络结构(借鉴一位b站up的画的图),同理s,m,l,x的网络整体结构哦都是一样的。因为它是基于YOLO v5构建的(在论文说是在yolov3的基础上进行改进),所以Backbone以及PAN部分和YOLO v5是一模一样的,注意这里说的YOLO v5是对应tag:v5.0
版本的。
相比于yolov5的主要改进之处:
- Anchor-Free
- decoupled detection head
- advanced label assigning strategy(SimOTA)
复现结果和细节
1 total param num 8,945,035,计算量:20.1 GFLOPS 2 backbone: CSPDarknet-53 3 优化器:adam,momentum=0.937,初始学习率:1e-3 学习率更新:呈cos函数形式 5 损失函数=Lcls+Lreg+Lobj,Lcls与Lobj(BCELoss),Lreg(IoULoss) 6 batch=8 7 加载官方完整预训练权重 yolovx_s.pth 8 epoch = 30 9 总训练时间: 4h 3m 3s 10 训练集:PASCALVOC-2012train(5717) 11 测试集:PASCALVOC-2012val(5823) 12 GPU: 4 x Tesla V100 13 平均推理时间和FPS:0.012s,83fps(RTX 3070ti)
利用wandb记录
本地画图记录
进行验证并获取各类别精度
coco指标,以s模型就能达到这个效果,感觉挺不错的。
效果展示
对比yolov5-s(左),效果明显好很多