摘要: Motivation 事件分类依赖于大量注释,因此zero-shot很重要 之前的zero-shot方法很依赖于从已知的事件类型推测新的事件类型,但是一旦新的类型与所有已知类型都不相似,那么这类方法就会失效。 本文使用事件参数的定义和上下文语义来表示标签,并且不基于任何训练数据 Task 预定义:事 阅读全文
posted @ 2022-10-26 15:07 TABball 阅读(113) 评论(0) 推荐(0) 编辑
摘要: 最近看了一些关于Rationale的方法,选取其中一篇写个笔记 Motivation 之前的rationale的方法中,选择器和预测器的结果来自于预测对真实答案的比较,这样的探索空间非常大。 通常用于实现rationale流畅性的正则化器以相同的方式对待所有相邻的token pairs。这通常会导致 阅读全文
posted @ 2022-10-14 15:38 TABball 阅读(45) 评论(0) 推荐(0) 编辑
摘要: Motivation 之前的研究很少关注“为什么模型会预测某一个输出”,基于 rationale graph 可以提供更好的可解释性 实体类型和触发词是预测实体关系的两个重要信息 如: Augustus is the youngest of five children of Hawkins PERS 阅读全文
posted @ 2022-10-12 15:30 TABball 阅读(119) 评论(0) 推荐(0) 编辑
摘要: Motivation 手动构造事件类型和标注数据成本非常高 手动标注的时间覆盖率比较低 Method 本文提出了一个基于VQ-VAE的半监督事件检测方法。 Trigger Representation Learning 句子表示为$s = [w_1, \dots, w_n]$,用所有subtoken 阅读全文
posted @ 2022-09-27 22:34 TABball 阅读(92) 评论(0) 推荐(0) 编辑
摘要: motivation 图神经网络已经被证明可以很好的解决长距离的语义依赖。但是 之前的方法大多使用固定的图,如依赖于外部解析器生成的图(句法依存图等) 图是固定的 无法使用梯度优化这个图 如果图建错了,误差传播 很多图都只关注了语法信息,而忽略了语义信息 the information conten 阅读全文
posted @ 2022-09-20 11:28 TABball 阅读(96) 评论(0) 推荐(0) 编辑
摘要: Motivation 之前的研究表明prompt可以提高模型在事件检测方面的性能,包括 使用特定structure 使用每种事件类型特定的query 原型 trigger 这些尝试启发对不同prompt效果的探究 Settings 作者在3种setting下做了实验: Supervised even 阅读全文
posted @ 2022-09-10 14:32 TABball 阅读(101) 评论(0) 推荐(0) 编辑
摘要: Motivation 很多研究忽视了事件抽取和阅读理解之间的关系 之前的使用阅读理解的工作都有监督地手动设计问题模板 本文的方法制造的模板与上下文相关 Approach Trigger extraction 因为trigger word一般是动词,不好设计问题,因此使用一个特殊标记[EVENT]来表 阅读全文
posted @ 2022-09-09 16:18 TABball 阅读(94) 评论(0) 推荐(0) 编辑
摘要: Motivation 本文的工作涉及到两个任务:属性条件生成、文本风格迁移。 之前的大量工作在很大程度上分别研究了这两个问题开发了不同的条件模型,但容易产生有偏见的文本. 本文从因果的角度将两个任务统一起来,分别视为在因果图上的“干预”和“反事实”两部分,然后再将框架应用于一个比较具有挑战性的场景中 阅读全文
posted @ 2022-07-05 15:28 TABball 阅读(121) 评论(0) 推荐(0) 编辑
摘要: Motivation 以前的模型大多都只依赖于encoder或关注于decoder,分别对于生成和理解任务是次优的; 此外,大多数现有的方法把code看作是像NL这样的标记序列,只是在其上采用传统的NLP预训练技术,这在很大程度上忽略了代码中丰富的结构性信息,而这对于完全理解代码的语义至关重要 In 阅读全文
posted @ 2022-04-25 15:34 TABball 阅读(751) 评论(0) 推荐(0) 编辑
摘要: Motivation 虽然语言建模方面,NLP模型表现很好,但是在逻辑推理和数值计算领域(称其为第二类任务,system-2 task),即使是目前最大的模型也难以处理某些推理任务,如数学单词问题、符号操作和常识性推理。 本文探讨了语言模型产生一个连贯的思维链的能力——一系列的短句子,模仿一个人在回 阅读全文
posted @ 2022-04-12 10:57 TABball 阅读(2861) 评论(0) 推荐(0) 编辑