03 2022 档案

摘要:论文:MetaFormer is Actually What You Need for Vision,(CVPR,2021) 论点:transformer的网络结构而不是self-attention tocken mixer使得模型效果好;为了证明此论点,作者将attention模块换成令人尴尬简单 阅读全文
posted @ 2022-03-29 15:31 ldfm 阅读(231) 评论(0) 推荐(0) 编辑
摘要:论文:Are we ready for a new paradigm shift? A Survey on Visual Deep MLP,review,2021年末 1. MLP、CNNs和transformer结构分析 MLP即为多层感知机,多层全连接网络前向堆叠而成,主要存在问题是参数量太大; 阅读全文
posted @ 2022-03-29 10:18 ldfm 阅读(674) 评论(0) 推荐(0) 编辑
摘要:数据采集传感器: 彩色和灰度立体相机(x = right, y = down, z = forward); 激光雷达(x = forward, y = left, z = up); 惯性导航系统(GPS/IMU)x = forward, y = left, z = up。 1、图片 保存为png格式 阅读全文
posted @ 2022-03-18 16:49 ldfm 阅读(258) 评论(0) 推荐(0) 编辑
摘要:two-stage open-vocabulary detectors: region proposal CLIP对proposal分类 阅读全文
posted @ 2022-03-18 15:26 ldfm 阅读(313) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示