Probabilistic and Geometric Depth: Detecting Objects in Perspective
作者认为单目3D目标检测可以简化为深度估计问题,深度估计不准确限制了检测的性能.已有的算法直接使用孤立实例或者像素估计深度,没有考虑目标之间的集合关系,因此提出了构建预测的目标之间的几何关系图,来促进深度预测.
将深度值划分成若干个区间,然后通过分布的期望来计算深度值,在精度和速度上都取得了不错的性能.PGD在FCOS3D的基础上实现,如下图所示.
深度预测模块比较复杂,首先是直接深度回归DR.然后,将深度离散化,假设检测范围为0~Dmax,离散单位为U,那么可以得到的分割点数量为C=|_Dmax/U_|.将这组分割点记为向量ω,那么可以引入一个并行于直接回归head的模块,来生成概率图DPM,用下面的式子解码:
DP就是概率深度(Probabilistic Depth).取Top-2置信度的均值作为深度置信度得分深度置信度得分(Depth Confidence Score).在推理时,深度置信度得分与中心度得分、分类得分相乘,作为最终的排序指标使用.使用下面的式子将DR和DP融合:
σ(⋅)是 sigmoid 函数,λ是一个与数据无关的学习参数.DL是每个孤立的实例的局部深度估计(Local Depth Estimation).
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 字符编码:从基础到乱码解决