基于双向图注意网络的层次邻居传播的关系预测

原文

Hierarchical Neighbor Propagation With Bidirectional Graph Attention Network for Relation Prediction

出版

IEEE/ACM Transactions on Audio, Speech and Language Processing
Volume 29
2021
pp 1762–1773
https://doi.org/10.1109/TASLP.2021.3079812

申明

版权归原文作者及出版单位所有，如有侵权请联系删除

摘要

图注意网络(GAT)自2018年起开始成为主流神经网络架构，在各种自然语言处理(NLP)任务中取得了显著的性能提升。虽然GAT作为知识图关系预测的一种成功方法已经达到了最先进的水平，但现有模型仍然存在以下两个方面的局限性:(1)现有模型只考虑给定实体的入方向的邻居，而忽略了出方向的丰富邻居信息;(2)现有模型仅使用k跳输出学习多跳嵌入，导致在图注意步骤丢失大量早期嵌入信息(如单跳)。在本研究中，我们提出了一种新的双向图注意网络(BiGAT)来学习分层邻居传播。在我们提出的BiGAT中，引入了一个入方向和一个出方向GAT，在传播双向邻域信息之前捕获足够的邻域信息，从而分层学习多跳特征嵌入。在4个公开的数据集上进行的实验表明，与其他先进的方法相比，BiGAT取得了竞争的结果。

文章贡献

针对KGE任务，提出了一种新的BiGAT模型。提出的BiGAT能够从每个实体的入方向和出方向捕获多跳邻居信息，这使模型能够利用更丰富的全局上下文信息。
我们利用注意力机制将每个BiGAT层的分层跳跃嵌入信息组合成一个统一的表示，使模型具有更强的鲁棒性，避免了早期嵌入信息丢失的问题。
我们在四个公开的基准数据集上进行了广泛的实验:WN18RR、FB15k-237、NELL-995和Kinship。实验结果表明，在MRR评价指标下，BiGAT方法获得了最佳的性能，在所有数据集上与其他先进的方法相比具有竞争力。

模型

双向嵌入传播

对于一个实体节点ei，我们通过如下方式计算其对应的出方向的三元组的表征：

其中W1是出方向的投影向量， ||表示连接符号。

同理，对于入方向的三元组，其表征如下：

对于每一个出方向的三元组，其对应的注意力权重计算公式如下：

入方向的三元组的注意力机制，其计算方式也和上面类似。

第(l + 1)层的输出嵌入是将第l层的邻域信息从入方向和出方向聚合得到的。我们将两个方向的邻域信息连接起来，并应用线性变换来更新实体嵌入，我们在BiGAT模型中使用多头注意，记为下式:

分级嵌入聚合

现存的GAT和KBGAT只使用最后的聚合输出(k-跳图注意结果)来学习实体嵌入，这样会忽略不同的每一跳的邻居的贡献。
为了解决这个问题，我们使用一种注意力机制来组合从BiGAT每一层的输出嵌入，这种通过充分利用每一条嵌入信息的方法可以充分捕获丰富的特征。
该思想的具体流程如下：

具体计算公式如下：

其中，上述的注意力权重是通过实体嵌入和跳嵌入计算得到，具体公式如下：

上述的h(l)就是跳嵌入，被用来编码每一层的位置信息，其中l属于范围[0, k]。
注意: 小编没有看懂h的来源以及计算

最终，实体嵌入的更新规则如下式所述：

在BiGAT每一层，我们使用一个线性变换来更新关系嵌入，具体表示如下：

最终的关系嵌入表示也是和实体嵌入类似，通过各层的注意力机制计算得到：

训练函数

三元组评分函数，具体公式如下：

损失函数被定义为如下：

性能评估

数据集

我们在四个公开的标准的数据集上面进行KGE任务，这四个数据集分别是：
WN18RR、FB15k-237、NELL-995、Kinship。

评估指标

我们采用嵌入的常见评估指标: MR、MRR、Hit@N。

评估结果

下表显示，我们的BiGAT模型在WN18RR和FB15k-237数据集上使用各种评估指标始终产生最佳性能，除了在WN18RR上的Hits@3和Hits@10以及在FB15k-237上的MR。

同时关于在NELL-995和Kinship的结果在下表，同样也有着相似的结果：

posted @ 2022-08-23 10:14 chaosliang 阅读(374) 评论(3) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 2018-GRAPH ATTENTION NETWORKS

· EIGAT:将全局信息纳入局部注意力中，进行知识表示学习

· Graph Attention Networks论文笔记

· 基于方面情感分析的关系图注意网络

· 图神经网络基础理论及实操

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配，妙~啊~
· .NET Core 中如何实现缓存的预热？

公告

昵称： chaosliang
园龄： 5年9个月
粉丝： 11
关注： 5

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

1. 基于关系路径的知识库表征学习(1)

最新评论

1. Re:OpenKE-PyTorch使用
@chaosliang 明白了，非常感谢你的回复~...
--_向阳
2. Re:OpenKE-PyTorch使用
@_向阳数据集文件里面给的是都是正样本，所以自己的数据集的话直接用正样本来替换那几个数据文件就行。负样本在后续代码中有生成，一般采取了替换掉正确三元组的头实体或者替换掉尾实体的方式生成。...
--chaosliang
3. Re:OpenKE-PyTorch使用
你好，近期才看到你的分享，觉得写的很好，想问一下openke这个给的数据集中的train或者test这些数据里面是包含负样本的吗，还是不包含后续代码中有生成
--_向阳
4. Re:基于双向图注意网络的层次邻居传播的关系预测
@chaosliang 好的好的，谢谢您的回复...
--废废小马
5. Re:基于双向图注意网络的层次邻居传播的关系预测
@废废小马抱歉，我没有程序...
--chaosliang