关系抽取 --- 远程监督 ---《DIAG-NRE: A Neural Pattern Diagnosis Framework for Distantly Supervised Neural Relation Extraction》
- 概述
为了减轻pattern编写的工作量,并能够对新的关系类型进行快速泛化,作者提出了一种 pattern诊断框架DIAG-NRE,该框架能够在人工专家的参与下,从噪声数据中自动总结和提炼高质量的关系模式
- 主要结构图:
-
- NRE Models
对于一个instance s, token成 [x1,x2,x3...xT].用X表示。每个xi都是有word emdbedding 和 position embedding 串联组成。
给定一个关系r, NRE model的作用就是 求出.其中X为一个句子的表示,r为关系,
为模型的参数。
- Pattern Extraction
动作是针对每一位的token采取保留还是去除(保留为0,去除为1)的操作。因为token xi是由word embidding和position embeding组成,只对word进行操作。
在进行了一系列的操作之后,a=(a1,a2,a3,a4) . X->X' T->T'
Rward:
我们的目的是找到最简单的序列X'来保持原始预测的可信度。
左边是对数似然项,以追求较高的预测置信度; 另一个是稀疏比项,以诱导保留token的稀疏性
State:
agent的state应该独立于NRE model的state;
agent的初始状态和NRE一样是X
Agent:
agent 以非自回归的方式 进行计算
在决定每个token的操作时,丰富上下文信息,,文章采用了BiLSTM进行了编码。
h为LSTM的隐藏层的个数
Optimization:
Pattern Induction:
之后,给定instances和actions,我们这样来产生pattern:
①相应的实体类型替换原始实体对
②通过agent来获得tokens和相对位置
③然后把剩余的token的相对位置进行进行归纳到4个情况:zero(两个token见中间没有被抹除的token),short(1-3tokens), medium(4-9 tokens), long (10 or more tokens) - Pattern Refinement (未完待续)
- Weak Label Fusion (未完待续)
- NRE Models
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)