Transformer Architecture
摘要:Transformer Architecture 前面我们完成了自己训练一个小模型,今天我们结合论文来学习一下Transformer的理论知识~ 概述 Transformer 模型于 2017 年在论文《注意力就是你所需要的一切》中首次提出。Transformer 架构旨在训练语言翻译目的模型。然而
阅读全文
posted @ 2024-06-03 20:28
posted @ 2024-06-03 20:28