摘要: 为什么是大 kernel 卷积? Transformer 目前在 CV 领域愈发火热,这份火热促使着优秀学者们思考一个更深层次的问题。部分学者认为 Transformer 之所以 work 更加本质的原因在于其大的感受野*(论文直达)*。根据有效感受野(ERF)理论,ERF 大小与 kernel 大 阅读全文
posted @ 2022-03-18 18:33 MegEngine 阅读(240) 评论(0) 推荐(0) 编辑