1401 位置编码公式详细理解补充
Self-Attention:对于每个词而言都是无位置关系,把每个词的顺序打乱,得到的注意力值依然不变
通过 t1 告诉你,x1 是在前面,x2 在 x1 的后面
位置编码
位置编码公式
位置编码怎么用
位置编码底层解释
sin(pos+k) = sin(pos)*cos(k) + cos(pos)*sin(k) # sin 表示的是偶数维度
cos(pos+k) = cos(pos)cos(k) - sin(pos)*sin(k) # cos 表示的是奇数维度
他特别在 pos+k 是 pos 和 k 的线性组合
我爱你 ,现在我做第三个词 “你” 的位置编码
pos = 3 = 1+2
pos + k = 3 = 1+2 = 1*2+1*2
pos = 10
1+9,2+8,3+7
这句话变成 “你爱我”,现在我们仍然做第三个词 “我” 的位置编码
pos = 3 = 1+2
pos + k = 3 = 1+2 = 1*2+1*2