摘要: 使用单流和双流方式学习丰富的object语义,然后迁移到只需要单流的开集检测任务上 开集检测网络可以理解为: 类无关的视觉proposal提取+语义丰富的image embedding-text embedding空间的投射+多模态预训练模型分类器的生成;主要是学习第一和第二部分,第三部分用已有的C 阅读全文
posted @ 2022-08-12 16:30 哈哈哈喽喽喽 阅读(180) 评论(0) 推荐(0) 编辑
摘要: 利用图文大模型给caption数据打bbox伪标签扩展数据,进而训练开集检测模型 1、动机 开集检测,在大规模caption数据集上预训练的网络有很强的开放分类能力,所以需要使用caption数据,但是caption数据没有box,所有怎么自动化生成caption的box信息 2、方法 2.1、伪b 阅读全文
posted @ 2022-08-12 11:04 哈哈哈喽喽喽 阅读(343) 评论(0) 推荐(0) 编辑