目标检测中到底要不要保留长宽比还是直接 resize?

这个问题可能有不同的观点。

关于保持长宽比(或 letterbox ,有些人喜欢说)

为什么要保持长宽比?

这更像是一个哲学问题。人们认为,保持高宽比有助于网络了解物体大小的自然变化(例如,一个人的界限框不可能超高和超窄,因为那将是一个街灯)。

为什么不保持长宽比呢?

如果你调整大小而不保持纵横比和纵横比失真不是巨大的超级巨大,网络仍然会学习。换句话说,如果您的输入图像没有疯狂的纵横比,那么添加或没有一点失真没有区别。事实上,有时它甚至会作为一个正则化或增强。

结论

只要您的应用程序不是太具体,并且您的 输入图像长宽比是有限的 (也就是说,如果您使用来自任何普通相机的图像进行训练) ,您就不应该对此过于担心

什么时候该担心这个?当你使用巨大的垂直或水平图像进行训练时,或者当你使用一些非常特殊的设备(如地球物理、无线电或光学传感器)拍摄的图像进行训练时。在这些情况下,您应该特别注意如何调整或分割图像。例如,对于无线电传感器的记录,如果你使用纵横比变形来调整大小,由于正弦波弯曲,一个特定频率的波将转换成另一个)

好吧,看来还是看你的数据啥样的。长宽比不大就可以不加,不加还可能有好处,一种正则的效果。长宽比大就可以保持长宽比。

来源:

https://ai.stackexchange.com/questions/24311/why-do-we-resize-images-before-using-them-for-object-detection

posted @ 2023-03-06 17:25  cold_moon  阅读(180)  评论(0编辑  收藏  举报