03 2022 档案

MetaFormer，探索transformer网络结构【读论文，网络结构】

摘要：论文：MetaFormer is Actually What You Need for Vision，（CVPR,2021）论点：transformer的网络结构而不是self-attention tocken mixer使得模型效果好；为了证明此论点，作者将attention模块换成令人尴尬简单阅读全文

posted @ 2022-03-29 15:31 ldfm 阅读(231) 评论(0) 推荐(0) 编辑

MLP是否可以发展为下一代视觉网络主干【读论文，网络结构】

摘要：论文：Are we ready for a new paradigm shift? A Survey on Visual Deep MLP，review，2021年末 1. MLP、CNNs和transformer结构分析 MLP即为多层感知机，多层全连接网络前向堆叠而成，主要存在问题是参数量太大；阅读全文

posted @ 2022-03-29 10:18 ldfm 阅读(674) 评论(0) 推荐(0) 编辑

KITTI数据集

摘要：数据采集传感器：彩色和灰度立体相机（x = right, y = down, z = forward）；激光雷达（x = forward, y = left, z = up）；惯性导航系统（GPS/IMU）x = forward, y = left, z = up。 1、图片保存为png格式阅读全文

posted @ 2022-03-18 16:49 ldfm 阅读(258) 评论(0) 推荐(0) 编辑

多模态，目标检测（ViLD）

摘要：two-stage open-vocabulary detectors: region proposal CLIP对proposal分类阅读全文

posted @ 2022-03-18 15:26 ldfm 阅读(313) 评论(0) 推荐(0) 编辑