目标检测中到底要不要保留长宽比还是直接 resize?
这个问题可能有不同的观点。
关于保持长宽比(或 letterbox ,有些人喜欢说)
为什么要保持长宽比?
这更像是一个哲学问题。人们认为,保持高宽比有助于网络了解物体大小的自然变化(例如,一个人的界限框不可能超高和超窄,因为那将是一个街灯)。
为什么不保持长宽比呢?
如果你调整大小而不保持纵横比和纵横比失真不是巨大的超级巨大,网络仍然会学习。换句话说,如果您的输入图像没有疯狂的纵横比,那么添加或没有一点失真没有区别。事实上,有时它甚至会作为一个正则化或增强。
结论
只要您的应用程序不是太具体,并且您的 输入图像长宽比是有限的 (也就是说,如果您使用来自任何普通相机的图像进行训练) ,您就不应该对此过于担心。
什么时候该担心这个?当你使用巨大的垂直或水平图像进行训练时,或者当你使用一些非常特殊的设备(如地球物理、无线电或光学传感器)拍摄的图像进行训练时。在这些情况下,您应该特别注意如何调整或分割图像。例如,对于无线电传感器的记录,如果你使用纵横比变形来调整大小,由于正弦波弯曲,一个特定频率的波将转换成另一个)
好吧,看来还是看你的数据啥样的。长宽比不大就可以不加,不加还可能有好处,一种正则的效果。长宽比大就可以保持长宽比。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现