【五期杨志】CCF-A(CVPR'20) End-to-End Object Detection with Transformers

Carion, Nicolas, et al. "End-to-end object detection with transformers." European conference on computer vision. Springer, Cham, 2020.

  针对传统目标检测算法中存在的一些问题,比如需要手动设置anchors、nms等参数,即需要过多的人工干预从而给模型带来不确定性。本文首次提出了端到端的目标检测模型,通过缩减人工预处理和后续处理,尽可能使模型从原始输入到最终输出,给模型更多的自我学习空间,从而提高模型检测的准确性和泛化能力。

  本文的优点在于使用object query代替了原来生成anchors的方式,利用二分图匹配代替了nms这一步,将很多不可学习的东西变得可学习,从而减少人工的干预,使得整个算法更加简单和高效。并且它是基于Transformer模型设计的,具有很强的泛化能力,在图像分割、姿态估计等其他计算机视觉任务上效果也很不错。

  本文的不足是对小物体的检测效果比较差,可能是transformer是从全局建模,更容易学习到全局特征,而不像faster rcnn 使用特定大小的anchor锚框。

2023年2月24日


posted @ 2023-02-24 13:23  方班隐私保护小组  阅读(34)  评论(0编辑  收藏  举报