摘要: Vision Transformer和MLP-Mixer是深度学习领域最新的两个体系结构。他们在各种视觉任务中都非常成功。视觉Vision Transformer的性能略好于MLP-Mixers,但更复杂。但是这两个模型非常相似,只有微小的区别。本文中将对两个模型中的组件进行联系和对比,说明了它们的 阅读全文
posted @ 2022-10-03 09:59 deephub 阅读(238) 评论(0) 推荐(0) 编辑