摘要: 链接:https://arxiv.org/abs/2009.06732 摘要 Transformer模型架构最近引起了极大的兴趣,因为它们在语言、视觉和强化学习等领域的有效性。例如,在自然语言处理领域,Transformer已经成为现代深度学习堆栈中不可缺少的主要部分。最近,提出的令人眼花缭乱的X- 阅读全文
posted @ 2022-03-28 14:49 鸿钧道人 阅读(320) 评论(0) 推荐(0) 编辑