摘要: 什么是Transformer? Transformer架构擅长处理文本数据,这些数据本身是有顺序的。他们将一个文本序列作为输入,并产生另一个文本序列作为输出。例如,讲一个输入的英语句子翻译成西班牙语。 Transformer的核心部分,包含一个编码器层和解码器层的堆栈。 为了避免混淆,我们把单个层称 阅读全文
posted @ 2024-03-26 20:49 野哥李 阅读(242) 评论(0) 推荐(0) 编辑