目标检测中到底要不要保留长宽比还是直接 resize?

这个问题可能有不同的观点。

关于保持长宽比(或 letterbox ，有些人喜欢说)

为什么要保持长宽比？

这更像是一个哲学问题。人们认为，保持高宽比有助于网络了解物体大小的自然变化(例如，一个人的界限框不可能超高和超窄，因为那将是一个街灯)。

为什么不保持长宽比呢？

如果你调整大小而不保持纵横比和纵横比失真不是巨大的超级巨大，网络仍然会学习。换句话说，如果您的输入图像没有疯狂的纵横比，那么添加或没有一点失真没有区别。事实上，有时它甚至会作为一个正则化或增强。

结论

只要您的应用程序不是太具体，并且您的 输入图像长宽比是有限的 (也就是说，如果您使用来自任何普通相机的图像进行训练) ，您就不应该对此过于担心。

什么时候该担心这个？当你使用巨大的垂直或水平图像进行训练时，或者当你使用一些非常特殊的设备(如地球物理、无线电或光学传感器)拍摄的图像进行训练时。在这些情况下，您应该特别注意如何调整或分割图像。例如，对于无线电传感器的记录，如果你使用纵横比变形来调整大小，由于正弦波弯曲，一个特定频率的波将转换成另一个)

好吧，看来还是看你的数据啥样的。长宽比不大就可以不加，不加还可能有好处，一种正则的效果。长宽比大就可以保持长宽比。

来源：

https://ai.stackexchange.com/questions/24311/why-do-we-resize-images-before-using-them-for-object-detection

posted @ 2023-03-06 17:25 cold_moon 阅读(180) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

coldMoon

知行合一

目标检测中到底要不要保留长宽比还是直接 resize?

来源：

公告