摘要: 论文主要处理Vision Transformer中的性能问题,采用推理速度不同的级联模型进行速度优化,搭配层级间的特征复用和自注意力关系复用来提升准确率。从实验结果来看,性能提升不错 来源:晓飞的算法工程笔记 公众号 论文: Not All Images are Worth 16x16 Words: 阅读全文
posted @ 2024-07-03 12:23 晓飞的算法工程笔记 阅读(219) 评论(0) 推荐(1) 编辑