摘要: 背景 相对于传统 CNN 模型来说,Transformer 模型的最大的一个特点就是灵活性。这个灵活性主要体现在模型中穿插大量的数据重排操作,即 Reshape 和 Transpose。如下图 1 所示,对于一个典型的 Attention 结构来说,Reshape 和 Transpose 操作的数量 阅读全文
posted @ 2025-02-15 18:07 地平线智能驾驶开发者 阅读(26) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示