MVF-Net

算法思想

融合相同点云的不同视角：（1）BEV；（2）Perspective View

视角	坐标系	优点	缺点
BEV	笛卡尔坐标系	形状不随距离改变	长距离时非常稀疏
Perspective	球坐标系	形状随距离改变、物体在点云场景下高度重叠	can represent the LiDAR range image densely, and can have a corresponding tiling of the scene in the Spherical coordinate system.

BEV视角是在笛卡尔坐标系下，每个体素是长方体。
Perspective view是球坐标系下，每个体素是frustum，采用PointPillasr的形式的话，在r方向上是不做限制的。

算法流程

Voxelization

体素化点云的过程分为两部分：（1）Grouping(根据坐标); (2)Sampling（根据体素容量随机采样或填充）
hard voxelization：给定点云集合\(P=\{p_1, p_2,...,p_N\}\)，将 \(N\) 个点云存入大小为 \(K\times T\times F\) 的buffer。其中 \(K\) 是Voxel的个数，\(T\) 是每个Voxel中的点云个数，\(T\) 是每个点云的特征个数。当Voxel（或者Voxel内的点）的总个数大于 \(K\)（或者 \(T\)）时进行下采样，不足时用0填充。
因为hard voxelization的采样过程的随机性，导致其可能产生不稳定的检测结果，同时填充也会增加计算量。
dynamic voxelization：Grouping过程不变，但是不进行Sampling，每个buffer不再采用固定大小，而采用动态的过程，保留了每个Voxel和每个Voxel内部的点。
如下对比图，对于hard voxelization这种采用固定buffer数量的方式，如果要保留所有的点，相比于dynamic voxelization需要分配更多的空间。

Feature Fusion

试验结果

KITTI数据集

posted @ 2022-03-20 22:39 小鸟飞飞11 阅读(256) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

Yinzp