摘要: Transformer Transformer是完全由Attention和Self-Attention结构搭建的深度神经网络结构。 其中最为重要的就是Attention和Self-Attention结构。 Attention结构 Attention Layer接收两个输入$X = [x_1, x_2 阅读全文
posted @ 2023-03-21 18:10 iSherryZhang 阅读(273) 评论(0) 推荐(0) 编辑