论文阅读-CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor Pre-Matching
摘要:
摘要 开集词汇检测(OVD)是一项目标检测任务,旨在检测训练检测器的基类之外的新类别对象。最近的开集词汇检测方法依赖于大规模的视觉-语言预训练模型,如CLIP,以识别新对象。我们确定了在将这些模型纳入检测器训练时需要解决的两大核心障碍:(1)当将训练于整幅图像的VL模型应用于区域识别任务时出现的分布 阅读全文