IoU及其变种，以及目前最佳Shape-IoU

1）IoU：

优点：能够准确地描述了预测框和GT框之间的匹配程度

缺点：当两个框的交点为0时，无法准确描述预测框和GT框之间的位置关系

2）GIoU：

优点：引入最小检测框来解决，其中C表示GT框和 Anchor 框之间的最小检测框。

3）DIoU：

b和bgt分别表示 Anchor 框的中心点和GT框的中心点，p表示欧几里得距离，其中c表示b和bgt之间的最小检测框的斜边长度。

优点：考虑了边界框之间的距离约束，并在IoU的基础上添加了中心点归一化距离损失项，从而使得回归结果更准确。

CIoU：

考虑预测框和GT框的中心点间的归一化距离最小化，增加了一个形状损失项来减少Anchor框和GT框之间的宽高比差异，以更准确地通过角的变化来判断预测框和GT框的匹配程度

4）EIoU

根据CIoU重新定义了形状损失，并进一步通过直接减小GT框和 Anchor 框之间的宽高比来提高检测精度

wc和hc分别表示最小检测框覆盖GT框和 Anchor 框的宽度和高度

5) SIoU

进一步考虑了边界框之间的角度对边界框回归的影响，旨在通过减小 Anchor 框和GT框之间的角度（水平或垂直方向）来加速收敛过程。

6)针对小目标点距离Dot Distance和Normalized Wasserstein Distance（NWD）被提出以克服对IoU值的敏感性；

a.Dot Distance

D表示GT框中心点与 Anchor 框中心点之间的欧几里得距离，S表示数据集中目标的平均大小，M表示图像的数量，Ni表示第i张图像中的标注边界框数量，wij和hij分别表示第i张图像中第j个边界框的宽度和高度。

b.Normalized Wasserstein Distance（NWD）

权重w=2，C与数据集相关的常数；

Shape-IoU

scale是缩放因子，与数据集中目标的大小相关，ww和hh分别表示水平方向和垂直方向上的权重系数，其值与GT框的形状有关。

针对小目标的Shape-Dot

将Shape-IoU思想融入点距离，得到Shape-Dot Distance

同样，将Shape-IoU融入归一化NWD中，得到Shape-NWD

posted @ 2024-01-03 11:20 jimchen1218 阅读(1623) 评论(0) 收藏举报

刷新页面返回顶部

顺势而为