自注意力机制self-attention

 

self-attention步骤:

 

(1)得到Q、K、V    

 

 

 

扩展到多头注意力机制:

 

 

 self-attention存在缺点:缺少位置信息

为每一个输入设置一个positional vector ei

 

 

posted on 2024-07-06 21:26  宝嗓我的娟子  阅读(2)  评论(0编辑  收藏  举报