自注意力机制最简单的示例

自注意力机制示例

1. 输入序列

假设我们有一个简单的输入序列，包含三个词（向量表示），每个词的维度是4：

我们定义查询、键和值的权重矩阵如下：

	Q	K	V
权重矩阵	1 0 0 1 0 1 1 0 1 0 0 1 0 1 1 0	0 1 1 0 1 0 0 1 0 1 1 0 1 0 0 1	1 0 1 0 0 1 0 1 1 0 1 0 0 1 0 1

查询、键和值矩阵计算如下：

	Q（Q*输入序列）	K（K*输入序列）	V（K*输入序列）
值	2 0 0 2 0 2 2 0 2 2 2 2	0 1 1 0 1 0 0 1 2 1 1 2	2 0 2 0 0 2 0 2 2 2 2 2

注意力得分的计算如下：(dk=2，根号4)

加权求和的计算如下：

	结果
Attention(Q, K, V)	2.329 1.576 2.329 1.576 1.690 1.534 1.690 1.534 2.819 2.818 2.819 2.818

这个例子展示了自注意力机制如何通过计算查询、键和值矩阵，然后计算注意力得分，最后进行加权求和，来生成输入序列中每个元素的表示。

posted @ 2024-08-06 15:13 海_纳百川阅读(178) 评论(0) 收藏举报

刷新页面返回顶部