【五期杨志】CCF-A（CVPR'20） End-to-End Object Detection with Transformers

Carion, Nicolas, et al. "End-to-end object detection with transformers." European conference on computer vision. Springer, Cham, 2020.

针对传统目标检测算法中存在的一些问题，比如需要手动设置anchors、nms等参数，即需要过多的人工干预从而给模型带来不确定性。本文首次提出了端到端的目标检测模型，通过缩减人工预处理和后续处理，尽可能使模型从原始输入到最终输出，给模型更多的自我学习空间，从而提高模型检测的准确性和泛化能力。

本文的优点在于使用object query代替了原来生成anchors的方式，利用二分图匹配代替了nms这一步，将很多不可学习的东西变得可学习，从而减少人工的干预，使得整个算法更加简单和高效。并且它是基于Transformer模型设计的，具有很强的泛化能力，在图像分割、姿态估计等其他计算机视觉任务上效果也很不错。

本文的不足是对小物体的检测效果比较差，可能是transformer是从全局建模，更容易学习到全局特征，而不像faster rcnn 使用特定大小的anchor锚框。

2023年2月24日

posted @ 2023-02-24 13:23 方班隐私保护小组阅读(84) 评论(0) 收藏举报

刷新页面返回顶部

方班隐私保护小组

【五期杨志】CCF-A（CVPR'20） End-to-End Object Detection with Transformers

公告