论文阅读 | Using Automatically Extracted Minimum Spans to DisentangleCoreference Evaluation from Boundary Detection

论文地址 :https://www.aclweb.org/anthology/P19-1408/

作者 :Nafise Sadat Moosavi1, Leo Born, Massimo Poesio, Michael Strube

机构 : Technische Universitat Darmstadt, Heidelberg University, Queen Mary University of London, Heidelberg Institute for Theoretical Studies gGmbH

 

研究的问题:

关注的是共指消解问题,也就是找到指向相同实体的不同表达式。一般解决该问题的方法是识别每个指代的最大跨度。为了解决这个问题,在较小的语料库中手工标注最小跨度。但是这个方案的标注成本比较高,本文做的就是提出了一种自动提取最小跨度的算法MINA。

研究方法:

为了解决最大跨度边界检测的复杂性,一些较小的语料库中明确标注了每个指代的最小跨度和最大跨度。传统的算法基于Gold parse tree和system parse tree,它们存在的问题是可能会产生不同的结果。MINA为了减少gold和system两种方法之间的性能差异而提出。

如何决定最小跨度:

从词所对应的解析树(constituency-based parse trees)中提取MINA范围,也就是说MINA范围是词对应的最大跨度的词的子集。对于对应的最大跨度的解析子树,以宽度优先的方式确定最小跨度。下面是算法描述。

 

其中,根是解析树的根,标记是用于提取最小跨度的可接受语法标记集,最小深度是解析树中最小跨度节点的深度,mini-spans是算法中对应于最小跨度的词集。可接受的终端节点集(acceptable terminal)指除限定词、连接词以外还包含至少一个词的节点集,终端节点不再进一步拆分。具体包括NP(名词短语)、NML(名词修饰语)、QP(包括量词的名词短语)、NX(一些特定的名词短语)和VP(唯一可接受的动词短语)。

在处理的过程中,以宽度优先的方式处理。跳过标记为不可接受的节点为根的子树。对于其余的节点,将所有的到根距离最近的终端节点作为最小跨度。

例子:

 

评估最小跨度:

评估包括以下两个指标:

(1)使用MINA提取出的最小跨度长度应小于最大跨度。

(2)MINA提取出的最小跨度和专家手动注释的是否一致。

实验结果如下:

 

这张表中的head也就是人工标注的结果。可以看到MINA总是大于head,可以认为MINA包含了大部分的指代。

作者分析了这种错误来源,主要来自于解析错误。如下面这张图。

 

 

 在共指关系任务上的实验:

 

结论:

(1)在跨数据集的评估中,使用最大跨度和最小跨度的评估结果差异比较大,这样因为在最大跨度中边界检测的错误更加明显,会影响评估结果。

(2)MINA在一定程度上减少了gold和system解析树之间的性能差异,也就是分别对两者使用MINA得到的最小跨度在一定程度上抹平了这一点。

(3)由于最大跨度的评估有更多的噪声,基于最小跨度的评估减少了这部分的影响。

 

评价:

本文提出的MINA,最大的优点在于,不增加额外标注成本的额情况下,基于gold和system解析树提取最小跨度。基于实验结果提出了对于共指关系任务评估的建议和看法。本文的一些分析还是很详细的,针对MINA本身还有共指关系任务上分别作了实验和分析。这个MINA算法在命名实体识别或者其他的一些NLP任务中应该也可以应用。

posted @ 2020-04-21 23:10  bernieloveslife  阅读(153)  评论(0编辑  收藏  举报