摘要: 目录 Transformer 1. 前言 2. Transformer详解3. 总结 2.1 Transformer整体结构 2.2 输入编码 2.3 Self-Attention 2.4 Multi-Head Attention 2.5 位置编码 2.6 残差结构 2.7 解码器结构 2.8 Th 阅读全文
posted @ 2021-02-06 13:25 早起的小虫子 阅读(4208) 评论(0) 推荐(0) 编辑