摘要: ###简介 Transformer 由 Google 在 2017 提出,是基于注意力机制的模型 https://arxiv.org/pdf/1706.03762.pdf Transformer 抛弃了 RNN 和 CNN RNN:顺序执行,无法并行处理,每个时刻的输出,都依赖上一个时刻的输出,对长 阅读全文
posted @ 2022-12-28 22:43 moon~light 阅读(309) 评论(0) 推荐(0) 编辑