2024 年 3月 25 日随笔档案 - 野哥李

2024年3月25日

摘要： Transformer 自注意力机制自注意力机制核心就是计算句子在编码过程中每个位置上的注意力权重，然后再以权重和的方式计算整个句子的隐含向量表示 attention核心？ self-attention 核心公式： \(\text{Attention}(Q,K,V) = \text{softmax 阅读全文

posted @ 2024-03-25 17:42 野哥李阅读(50) 评论(0) 推荐(0) 编辑

公告

微信公众号： AI算法学习社

CSDN主页： YEGE学AI算法

昵称：野哥李
园龄： 7年4个月
粉丝： 6
关注： 3

+加关注

公告

搜索

最新随笔

随笔分类

阅读排行榜

评论排行榜

推荐排行榜

最新评论