目标检测中到底要不要保留长宽比还是直接 resize?

目录

 


这个问题可能有不同的观点。

关于保持长宽比(或 letterbox ,有些人喜欢说)

为什么要保持长宽比?

这更像是一个哲学问题。人们认为,保持高宽比有助于网络了解物体大小的自然变化(例如,一个人的界限框不可能超高和超窄,因为那将是一个街灯)。

为什么不保持长宽比呢?

如果你调整大小而不保持纵横比和纵横比失真不是巨大的超级巨大,网络仍然会学习。换句话说,如果您的输入图像没有疯狂的纵横比,那么添加或没有一点失真没有区别。事实上,有时它甚至会作为一个正则化或增强。

结论

只要您的应用程序不是太具体,并且您的 输入图像长宽比是有限的 (也就是说,如果您使用来自任何普通相机的图像进行训练) ,您就不应该对此过于担心

什么时候该担心这个?当你使用巨大的垂直或水平图像进行训练时,或者当你使用一些非常特殊的设备(如地球物理、无线电或光学传感器)拍摄的图像进行训练时。在这些情况下,您应该特别注意如何调整或分割图像。例如,对于无线电传感器的记录,如果你使用纵横比变形来调整大小,由于正弦波弯曲,一个特定频率的波将转换成另一个)

好吧,看来还是看你的数据啥样的。长宽比不大就可以不加,不加还可能有好处,一种正则的效果。长宽比大就可以保持长宽比。

来源:

https://ai.stackexchange.com/questions/24311/why-do-we-resize-images-before-using-them-for-object-detection

posted @   Zenith_Hugh  阅读(258)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现

喜欢请打赏

扫描二维码打赏

微信打赏

点击右上角即可分享
微信分享提示