摘要:
前言 UNet 可以算是 FCN 的一种变体,是最常用、最简单的一种分割模型,简单、高效、易懂、容易构建,且可以从小数据集中训练。 Transformer、目标检测、语义分割交流群 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 【百篇论文阅读计划 阅读全文
摘要:
前言 《从零搭建pytorch模型教程》系列完结了,准备开启一个新的系列,叫《入门必读系列》,但由于本人事情多到根本忙不完,这次决定改一改,不再由本人全部原创了,而是从公众号以往的文章或现有书中截图或从别人的知乎博客上转载,拼凑出一个完整的入门必读系列。用于弥补很多人基础不牢的问题。 欢迎关注公 阅读全文
摘要:
前言 针对定位精度受到不准确边界框的严重影响,而分类精度受影响较小,因此本文提出利用分类作为指导信号来改进定位结果。通过将目标视为实例包,作者提出了一种目标感知多实例学习方法(OA-MIL),其特点是目标感知实例选择和目标感知实例扩展。前者旨在为训练选择准确的实例,而不是直接使用不准确的框标注。后者 阅读全文
摘要:
前言 论文提出了一种在多个大规模数据集上训练统一检测器的通用方法。使用特定于数据集的训练协议和损失,但与特定于数据集中的输出共享公共检测架构。与之前的工作相比,该方法不需要手动分类协调。实验表明,本文学习的分类法在所有数据集中都优于专家设计的分类法。并且多数据集检测器在每个训练域上的性能与特定于数据 阅读全文
摘要:
前言 目前,大多数现有的基于transformer的视觉模型只是借用了自然语言处理的思想,忽略了语言和图像之间的关键差异,特别是空间扁平像素特征的巨大序列长度。这阻碍了在像素特征和对象查询之间交叉注意的学习。在本文中,作者重新思考像素和对象查询之间的关系,并提出将交叉注意学习重新定义为一个聚类过程。 阅读全文
摘要:
前言 论文提出了一种新的多视图分布式目标框架,以有效地减少训练和测试阶段的过拟合。具体来说就是,在训练阶段,开发了一种多视图正则化元学习算法,利用多个优化轨迹产生适合模型更新的优化方向。在测试阶段,利用多幅增强图像进行多视图预测,缓解了预测不稳定的问题,显著提高了模型的可靠性。在三个基准数据集上的大 阅读全文
摘要:
前言 论文提出了一个新的框架,“prune, then distill”,该框架首先剪枝模型,使其更具可移植性,然后提取给student。并进一步从理论上证明了剪枝后的teacher在蒸馏中起到正则化器的作用,减少了泛化误差。在此基础上,还提出了一种新的神经网络压缩方案,其中student网络是基于 阅读全文
摘要:
前言 与传统的两段pipeline不同,论文提出了在一段检测之后再进行区域级的选择,避免了处理大量低质量的候选区域。此外,还构建了一个新的模块来评估目标帧与参考帧之间的关系,并指导聚合。作者进行了大量的实验来验证该方法的有效性,并揭示了其在有效性和效率方面优于其他最先进的VID方法。在ImageNe 阅读全文
摘要:
前言 论文指出,大规模目标的性能下降是由于集成FPN后出现了不正确的反向传播路径。它使得骨干网络的每一层仅具有查看特定尺度范围内的目标的能力。基于这些分析,提出了两种可行的策略,以使主干的每一层都能够查看基于FPN的检测框架中的所有目标。一种是引入辅助目标函数,使每个主干层在训练期间直接接收各种尺度 阅读全文
摘要:
前言 在本文中,作者提出了一种基于高斯感受野的标签分配(RFLA)策略用于微小目标检测。并提出了一种新的感受野距离(RFD)来直接测量高斯感受野和地面真值之间的相似性,而不是使用IoU或中心采样策略分配样本。考虑到基于IoU阈值和中心采样策略对大对象的倾斜,作者进一步设计了基于RFD的分层标签分配( 阅读全文