摘要: Transformer模型由《Attention is All You Need》提出,有一个完整的Encoder-Decoder框架,其主要由attention(注意力)机制构成。论文地址:https://arxiv.org/abs/1706.03762。 其整体结构如图所示: 模型分为编码器(E 阅读全文
posted @ 2019-11-15 20:55 sunshine丶23 阅读(3771) 评论(0) 推荐(0) 编辑