摘要: 近年来,Vision Transformer(ViT)在计算机视觉领域取得了巨大突破。然而ViT模型通常计算复杂度高,难以在资源受限的移动设备上部署。为了解决这个问题,研究人员提出了Convolutional Additive Self-attention Vision Transformers ( 阅读全文
posted @ 2024-09-18 09:56 deephub 阅读(20) 评论(0) 推荐(0) 编辑