03 2022 档案
摘要:论文:MetaFormer is Actually What You Need for Vision,(CVPR,2021) 论点:transformer的网络结构而不是self-attention tocken mixer使得模型效果好;为了证明此论点,作者将attention模块换成令人尴尬简单
阅读全文
摘要:论文:Are we ready for a new paradigm shift? A Survey on Visual Deep MLP,review,2021年末 1. MLP、CNNs和transformer结构分析 MLP即为多层感知机,多层全连接网络前向堆叠而成,主要存在问题是参数量太大;
阅读全文
摘要:数据采集传感器: 彩色和灰度立体相机(x = right, y = down, z = forward); 激光雷达(x = forward, y = left, z = up); 惯性导航系统(GPS/IMU)x = forward, y = left, z = up。 1、图片 保存为png格式
阅读全文
摘要:two-stage open-vocabulary detectors: region proposal CLIP对proposal分类
阅读全文