FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection

FCOS3D是在2D检测器FCOS的基础上提出的,是一种单目3D检测算法,根据RGB图像进行3D目标检测.FCOS预测的是一个前景点到边界框的4个距离,而FCOS3D需要预测更多的东西,包括3D中心点,3D尺寸,以及目标的方向.

整体结构上,FCOS3D和FCOS非常类似,Backbone和Neck完全一致,区别在于Head,Classification,Centerness以及和3D相关的各种输出都有自己独立的Head.

损失函数较为复杂,分类使用Focal Loss:

回归基本上使用SmoothL1 Loss,方向分类和Center-ness使用Binary Cross Entropy:

总的损失:

在nuScenes数据集上进行了测试:

posted @ 2022-09-29 20:56  MSTK  阅读(836)  评论(0编辑  收藏  举报