摘要: 不到两年的时间ViT 已经彻底改变了计算机视觉领域,利用transformers 强大的自注意机制来替代卷积,最近诸如 MLP-Mixer 和通过精心设计的卷积神经网络 (CNN) 等方法也已经实现了与 ViT 相当的性能。 在新论文 Sequencer: Deep LSTM for Image C 阅读全文
posted @ 2022-05-12 11:15 deephub 阅读(77) 评论(0) 推荐(0) 编辑