摘要: \(transformer\) 解决任务 1.特点 摒弃了循环结构,通过自注意力机制衡量上下文单词的重要程度 说人话就是联系前后单词对于该单词的影响来完成本单词的翻译 2.运行逻辑 在运行前,由于摒弃了循环结构,我们需要在词语中嵌入位置编码来构建单词的向量表示,模型利用每个词语的位置与维度构建单独位 阅读全文
posted @ 2024-07-20 16:13 zeroqq 阅读(2) 评论(0) 推荐(0) 编辑
Live2D