【Transformer】01-TransFormer架构解析

Transformer模型的作用：

基于seq2seq架构的transformer模型可以完成NLP领域研究的典型人物,如机器翻译,文本生成等,同时又可以构造预训练语言模型,用于不同任务的迁移学习

在接下来的架构分析中,我们将假设的Tranformer模型架构从一种语言文本到另一种语言文本的翻译工作,因为很多命名方式遵循NLP的规则,如：Embedding层

将乘坐文本嵌入层,Embedding层产生的张量成为词嵌入张良,他的最后一维将称作词向量等

源文本嵌入层及其位置编码器

目标文本嵌入层及其位置编码器

线性层

softmax处理器

posted @ 2022-06-20 20:38 王广元阅读(239) 评论(0) 编辑收藏举报

刷新页面返回顶部