论文笔记-ResNeSt-Split-Attention Networks

ResNeSt是对ResNext的又一个魔改的变种，亚马逊李沐团队的作品，其中S代表split，可以理解为按channel切分的feature map。ResNeSt是在ResNeXt的cardinality基础上又引入一个radix（R），来表示每个cardinality group中的split的个数
- 简单理解，ResNeXt的cardinality将一组channel分成不同的组（这里称为cardinality group），ResNeSt是将一组cardinality group中的channel分成不同的split
从实验结果上开，效果还是很amazing的
- ResNeSt-50在ImageNet上的top-1 error为81.13%，超过ResNet-50大概1%
- ResNeSt-50替换Faster rcnn中的backbone，coco的mAP从39.25%提升到42.33%
- ResNeSt-50替换DeepLabV3中的backbone，ADE20K上的分割mIoU从42.1%提升到45.1%

使用的resnet结构是ResNet-D，结构如下
训练策略
- large mini-batch distributed training
- label smoothing
- auto augmentation
- mixup training
- large crop size: 224（ResNet变种对比），256（和其他模型对比）
- Regularization: Dropout、DropBlock、weight decay
- cosine schedule
实际实现时用的是radix-major的方式，这种方式的话，计算起来更方便一些（这样布局，相同radix-index的group在内存中布局一样），从布局上看相对于把前面图中的cardinality和split两个转换一下，如下图

写在后面

看ResNeSt，以及其他一些最新的文章，都能够看到attention的身影，给每个feature map分配一个权重，想到以前用传统方法做多模态目标跟踪的权重融合方式，何其相似。。。

posted @ 2020-05-18 22:30 StoneclutterX 阅读(1411) 评论(0) 编辑收藏举报

刷新页面返回顶部

StoneclutterX