随笔分类 - 三维目标检测
摘要:『笔记』DeepFusion 一个point-level fusion的方式,实际上是voxel级别上paint. 虽然用了cross attention不过其关注点其实是在于alignment quality上 3. DeepFusion 3.1. Deep Feature Fusion Pipe
阅读全文
摘要:『笔记』PointAugmenting 一个point-level fusion的方法,主要有两个点:1. 使用camera feature paint点云,但经过voxel encoding后的3d conv是对于lidar的feature和cat过来的camera feature分别进行的,然后
阅读全文
摘要:『笔记』M^2Det 2022年上半年同样一篇LSS流派做纯视觉的multi-view images的三维目标检测。在这里做一个简单记录 3 Method 3.1 M^2BEV Pipeline Part1: 2D Image Encoder. Part2: 2D→3D Projection. Pa
阅读全文
摘要:『笔记』BEVDet 2021年开始做BEV检测相对比较早的的一篇,使用LSS方法,做纯视觉的multi-view images的三维目标检测。在这里做一个简单记录 3 Methodology 3.1 Network Structure Image-view Encoder By default,
阅读全文
摘要:『笔记』DETR3D CORL2021的一篇文章,使用DETR的检测范式来直接做multi-view images的三维目标检测 3 Multi-view 3D Object Detection 大部分还是很清楚的,符号和公式也比较多,便于理解。不过,非常让我不解的就是文章里的公式(4),将当前ob
阅读全文
摘要:『笔记』CVT Cross-view Transformers for real-time Map-view Semantic Segmentation CVPR2022 oral的文章。方法的结构十分简练,为我们展现了一个关于使用transformer(具体来说,是cross-(view-)att
阅读全文
摘要:『笔记』CenterPoint CenterPoint也算是鼎鼎有名了,但是感觉论文的方法那里写得实在是敷衍,可能确实主要是用了一下CenterNet的head思路,没什么好说的吧。 4. CenterPoint The first stage of CenterPoint predicts a c
阅读全文
摘要:『笔记』Part-^2 https://arxiv.org/abs/1907.03670 论文阅读:3D点云目标检测 Part-A^2 Net 2020TPAMI—Part A2: 3D Object Detection from Point Cloud with Part-aware and Pa
阅读全文
摘要:『笔记』PV-RCNN CVPR2020的文章,在自动驾驶领域Waymo Open Challenge点云挑战赛中取得了(所有不限传感器算法榜单)三项亚军,Lidar单模态算法三项第一的成绩,以及在KITTI Benchmark上保持总榜第一的成绩超过半年。个人感觉这篇文章在点云方向PointNet
阅读全文
摘要:『笔记』Fast Point R-CNN 这是一篇来自ICCV2019的论文,乍一看觉得是PointRCNN的升级版,但其实并不是Point RCNN的incremental work,不过当然,同样作为two stage的方法,思想当然是有共同点的。这个名字比较有误导性,让人觉得一阶段是Point
阅读全文
摘要:『笔记』PointRCNN 2019 CVPR 香港中文大学的一篇3D目标检测的文章,是第一个输入只有原始点云数据的两阶段3D目标检测方法。文章比较老了,就没有阅读原文,在知乎上看了这篇说得不错:论文阅读:PointRCNN 第一个基于原始点云的3D目标检测,基本能够大致了解了 总得来说,该方法分为
阅读全文
摘要:『笔记』CBGS 1. Introduction Finally, our contributions in this challenge can be concluded as follows: • We propose class-balanced sampling strategy to ha
阅读全文
摘要:『笔记』BEVFusion 1 Introduction We propose BEVFusion to unify multi-modal features in a shared bird’s-eye view (BEV) representation space for task-agnost
阅读全文
摘要:『笔记』LSS 1 Introduction Computer vision algorithms generally take as input an image and output either a prediction that is coordinate-frame agnostic. T
阅读全文
摘要:『论文』PointPainting 2. PointPainting Architecture 2.1. Image Based Semantics Network The image sem.seg. network takes in an input image and outputs per
阅读全文
摘要:『笔记』KITTI KITTI devkit_object包 浏览devkit_object.zip内容 This file describes the KITTI 2D object detection and orientation estimation benchmark, the 3D ob
阅读全文
摘要:『论文』PointNet++ https://zhuanlan.zhihu.com/p/266324173 Few prior works study deep learning on point sets. PointNet [20] is a pioneer in this direction.
阅读全文
摘要:『论文』PointNet 1. Introduction To perform weight sharing and other kernel optimizations, most researchers typically transform such data to regular 3D vo
阅读全文
摘要:『论文』VoxelNet 2. VoxelNet 2.1. VoxelNet Architecture 2.1.1 Feature Learning Network Voxel Partition + Grouping + Random Sampling Stacked Voxel Feature
阅读全文
摘要:『论文』SECOND 1. Introduction The key contributions of our work are as follows: We propose an improved method of sparse convolution that allows it to run
阅读全文