3D目标检测---GS3D

论文解读

3D BBox的描述为：$$B_g=(w_g, h_g, l_g, x_g, y_g, z_g, \theta_g)$$
其中，特定类别的物体大小$(w_g, h_g, l_g)$可通过数据集先验数据获得，自动驾驶场景下假设物体都是底面和地面平行，所以只有偏航角。
该算法通过主题流程为：

CNN预测出2D BBox和观察角，相机的内参矩阵已知：

\[(x^{2d}, y^{2d}, w^{2d}, h^{2d})，\alpha, K \]

先验：

底面和顶面中心点在图像坐标系下坐标为：

\[C_t^{2d}=(x^{2d}, y^{2d}-h^{2d}/2, 1) \]

\[C_b^{2d}=(x^{2d}, y^{2d}+(0.5-\lambda)h^{2d}, 1) \]

根据相机内参矩阵$K$可得底面和顶面中心点在相机坐标系下的标准化坐标：

\[\hat{C_t}=K^{-1}C_t^{2d}, \hat{C_b}=K^{-1}C_b^{2d} \]

再根据类别先验真实高度 $h_g$ 和标准化高度 $\hat{y}_b-\hat{y}_t$ 可得深度为：

\[d = h_g/(\hat{y}_b-\hat{y}_t) \]

根据深度和相机坐标系下的标准化坐标可得地面中心在相机坐标系下的绝对坐标：

\[C_b=dK^{-1}C_b^{2d} \]

根据Kitti坐标系中观察角和偏航角的关系，可求得偏航角：

\[\theta=\alpha + arctan(z_b/x_b) \]

至此求得了3D物体的坐标：

\[() \]

根据观察角：

角度范围	可视面
$\alpha>0$	前端面
$\alpha<0$	后断面
$-90<\alpha<90$	右端面
otherwise	左端面
将可可视面坐标投影到2D图像坐标系，找到特征图上对应的特征，进行特征提取。

posted @ 2022-03-28 15:02 小鸟飞飞11 阅读(395) 评论(0) 编辑收藏举报

刷新页面返回顶部

角度范围	可视面
\(\alpha>0\)	前端面
\(\alpha<0\)	后断面
\(-90<\alpha<90\)	右端面
otherwise	左端面
将可可视面坐标投影到2D图像坐标系，找到特征图上对应的特征，进行特征提取。