图解transformer中的自注意力机制

本文将将介绍注意力的概念从何而来，它是如何工作的以及它的简单的实现。

注意力机制

在整个注意力过程中，模型会学习了三个权重:查询、键和值。查询、键和值的思想来源于信息检索系统。所以我们先理解数据库查询的思想。

假设有一个数据库，里面有所有一些作家和他们的书籍信息。现在我想读一些Rabindranath写的书：

在数据库中，作者名字类似于键，图书类似于值。查询的关键词Rabindranath是这个问题的键。所以需要计算查询和数据库的键(数据库中的所有作者)之间的相似度，然后返回最相似作者的值(书籍)。

posted @ 2023-06-20 09:43 deephub 阅读(232) 评论(0) 收藏举报

刷新页面返回顶部