CuVLER：通过穷尽式自监督Transformer增强无监督对象发现

介绍了VoteCut，这是一种创新的无监督对象发现方法，它利用了来自多个自监督模型的特征表示。VoteCut采用基于归一化切割的图分割、聚类和像素投票方法。此外，还介绍了CuVLER（Cut-Vote-and-LEaRn），一种零样本模型，使用VoteCut生成的伪标签进行训练，以及一种新的软目标损失来提高分割精度。通过对多个数据集和几个无监督设置的严格评估，新方法与之前的最先进模型相比有了显著的改进。消融研究进一步强调了每个组成部分的贡献，揭示了新方法的稳健性和有效性。VoteCut和CuVLER共同为图像分割的未来发展铺平了道路。项目代码可在GitHub上找到

VoteCut工作流程的图解、聚类和投票阶段，如图3-33所示。

图3-33 VoteCut工作流程的图解、聚类和投票阶段

在图3-33中，（a）VoteCut工作流程的图解概述。一组模型最初对输入图像进行推理，为单个补丁生成特征表示。随后，按照该方法执行归一化切割（NCut），从每个模型中得到第二小的特征向量。通过对这些具有不同K值的特征向量应用1D K-均值聚类，生成了多个分段改进。VoteCut的最后阶段涉及对这些改进方案进行聚类，并通过投票从每个聚类中提取否定掩码。每个定义掩码也与一个分数相关联。（b）详细介绍了VoteCut的聚类和投票阶段。首先，使用联合交叉点（IoU）阈值对分段进行聚类，确定簇内的分段成员资格。

在每个集群内采用投票机制来决定每个补丁是否应包含在该段中。最后，应用条件随机域（CRF）在优秀级别重新定义掩码。簇大小决定了分配给每个掩码的分数。