会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
sy
博客园
首页
新随笔
联系
管理
2024年4月6日
注意力机制 transformer
摘要: https://jalammar.github.io/illustrated-transformer/ X就是输入的向量 ,第一步就是创建三个输入向量qkv 第二步是计算分数:分数决定了对输入句子的其他部分的关注程度。 分数是通过查询向量与我们要评分的各个单词的键向量的点积来计算的。因此,如果我们处
阅读全文
posted @ 2024-04-06 19:37 sy-
阅读(17)
评论(0)
推荐(0)
编辑
公告