2024 年 5月随笔档案 - fariver

[Paper Reading] MOTR: End-to-End Multiple-Object Tracking with Transformer

摘要：MOTR: End-to-End Multiple-Object Tracking with Transformer link 时间：22.07 机构：Megvii TL;DR 传统MOT通过motion与appearance来建模，有复杂的后处理难以E2E。本文基于DETR设计出MOTR算法，通过阅读全文

posted @ 2024-05-30 23:12 fariver 阅读(348) 评论(0) 推荐(0) 编辑

[Paper Reading] FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin

摘要：FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin link 时间：23.11 机构：houmo.ai 后摩智能 TL;DR 当时比较流行的OCC方案内存与计算复杂度较高，本文提出阅读全文

posted @ 2024-05-29 20:52 fariver 阅读(121) 评论(0) 推荐(0) 编辑

[Paper Reading] Scene as Occupancy

摘要：Scene as Occupancy link 时间：23.06 机构：Shanghai AI Lab && SenseTime && CUHK TL;DR 提出使用3D Occupancy来表征3D物理场景，相对于3D检测框，3D Occ可提供更细粒度细节。提出OccNet一种多目级连的时序模型，阅读全文

posted @ 2024-05-22 17:17 fariver 阅读(117) 评论(0) 推荐(0) 编辑

[Paper Reading] BEVFormer: Learning Bird’s-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers

摘要：BEVFormer: Learning Bird’s-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers link 时间：22.07 机构：Nanjing University && Sha 阅读全文

posted @ 2024-05-20 21:44 fariver 阅读(131) 评论(0) 推荐(0) 编辑

[Paper Reading] PETR: Position Embedding Transformation for Multi-View 3D Object Detection

摘要：PETR: Position Embedding Transformation for Multi-View 3D Object Detection PETR: Position Embedding Transformation for Multi-View 3D Object Detection 阅读全文

posted @ 2024-05-15 16:58 fariver 阅读(214) 评论(0) 推荐(0) 编辑

[Paper Reading] BEVDet: High-Performance Multi-Camera 3D Object Detection in Bird-Eye-View

摘要：BEVDet: High-Performance Multi-Camera 3D Object Detection in Bird-Eye-View BEVDet 时间：21/12 机构：PhiGo(鉴智机器人) TL;DR 一种BEV空间做detection的方法，构建了新颖的数据增强方法以及更新阅读全文

posted @ 2024-05-14 14:12 fariver 阅读(125) 评论(0) 推荐(0) 编辑

[Paper Reading] OFT Orthographic Feature Transform for Monocular 3D Object Detection

摘要：OFT Orthographic Feature Transform for Monocular 3D Object Detection OFT Orthographic Feature Transform for Monocular 3D Object Detection 时间：18.11 机构：阅读全文

posted @ 2024-05-07 21:22 fariver 阅读(107) 评论(0) 推荐(0) 编辑

[Paper Reading] LSS: Lift, Splat, Shoot: Encoding Images from Arbitrary Camera Rigs by Implicitly Unprojecting to 3D

摘要：名称 Lift, Splat, Shoot: Encoding Images from Arbitrary Camera Rigs by Implicitly Unprojecting to 3D 时间：20.08 机构：NVIDIA TL;DR 后融合方法将每一目感知结果通过相机参数转换到BEV空阅读全文

posted @ 2024-05-06 22:58 fariver 阅读(168) 评论(0) 推荐(0) 编辑

fariver

05 2024 档案

公告

搜索

常用链接

我的标签

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论