Fork me on GitHub
摘要: https://jalammar.github.io/illustrated-transformer/ X就是输入的向量 ,第一步就是创建三个输入向量qkv 第二步是计算分数:分数决定了对输入句子的其他部分的关注程度。 分数是通过查询向量与我们要评分的各个单词的键向量的点积来计算的。因此,如果我们处 阅读全文
posted @ 2024-04-06 19:37 sy- 阅读(17) 评论(0) 推荐(0) 编辑