EfficientFormer:高效低延迟的Vision Transformers

我们都知道Transformers相对于CNN的架构效率并不高，这导致在一些边缘设备进行推理时延迟会很高，所以这次介绍的论文EfficientFormer号称在准确率不降低的同时可以达到MobileNet的推理速度。

Transformers能否在获得高性能的同时，跑得和MobileNet一样快?为了回答这个问题，作者首先回顾了基于vit的模型中使用的网络架构和运算，并说明了一些低效的设计。然后引入一个维度一致的纯Transformer(没有MobileNet块)作为设计范例。最后以延迟为目标进行优化设计，获得一系列称为EfficientFormer的最终模型。最后还设计了EfficientFormerV2。

https://avoid.overfit.cn/post/eb0e56c5753942cf8ee70d78e2cd7db7

posted @ 2023-09-26 09:55 deephub 阅读(22) 评论(0) 编辑收藏举报

刷新页面返回顶部

deephub

overfit深度学习

EfficientFormer:高效低延迟的Vision Transformers

公告