09 2022 档案
摘要:前言 针对定位精度受到不准确边界框的严重影响,而分类精度受影响较小,因此本文提出利用分类作为指导信号来改进定位结果。通过将目标视为实例包,作者提出了一种目标感知多实例学习方法(OA-MIL),其特点是目标感知实例选择和目标感知实例扩展。前者旨在为训练选择准确的实例,而不是直接使用不准确的框标注。后者
阅读全文
摘要:前言 论文提出了一种在多个大规模数据集上训练统一检测器的通用方法。使用特定于数据集的训练协议和损失,但与特定于数据集中的输出共享公共检测架构。与之前的工作相比,该方法不需要手动分类协调。实验表明,本文学习的分类法在所有数据集中都优于专家设计的分类法。并且多数据集检测器在每个训练域上的性能与特定于数据
阅读全文
摘要:前言 目前,大多数现有的基于transformer的视觉模型只是借用了自然语言处理的思想,忽略了语言和图像之间的关键差异,特别是空间扁平像素特征的巨大序列长度。这阻碍了在像素特征和对象查询之间交叉注意的学习。在本文中,作者重新思考像素和对象查询之间的关系,并提出将交叉注意学习重新定义为一个聚类过程。
阅读全文
摘要:前言 论文提出了一种新的多视图分布式目标框架,以有效地减少训练和测试阶段的过拟合。具体来说就是,在训练阶段,开发了一种多视图正则化元学习算法,利用多个优化轨迹产生适合模型更新的优化方向。在测试阶段,利用多幅增强图像进行多视图预测,缓解了预测不稳定的问题,显著提高了模型的可靠性。在三个基准数据集上的大
阅读全文