摘要: 不引入caption数据,使用coco数据集,使用CLIP 作为teacher模型蒸馏出Mask RCNN模型的检测能力(主要是训练出Mask RCNN能提取出类无关的box和该box的特征能和CLIP text embedding能很好的match),novel类检测能力通过伪novel类的框+推 阅读全文
posted @ 2022-08-18 21:50 哈哈哈喽喽喽 阅读(731) 评论(0) 推荐(0) 编辑