Loading

摘要: 对Transformer的一些理解 在学习Transformer这个模型前对seq2seq架构有个了解时很有必要的 先上图 输入和输出 首先理解模型时第一眼应该理解输入和输出最开始我就非常纠结 有一个Inputs,一个Outputs(shift right)和一个Output Probabilities,首先需要借助这三个输入/输出来 阅读全文
posted @ 2024-07-02 15:30 [X_O] 阅读(511) 评论(1) 推荐(3) 编辑