摘要: COLING 2020发布了今年的录用文章。 机构分类 Thunlp 这次没有关系抽取,一篇用HowNet做消歧,一篇少样本关系分类。 Try to Substitute: An Unsupervised Chinese Word Sense Disambiguation Method Based 阅读全文
posted @ 2020-10-21 10:36 YoungF 阅读(1138) 评论(0) 推荐(0)
摘要: 零 序 从三个部分介绍知识图谱(Knowledge Graph, KG),最后做总结: 基础篇:定义、简史、存储和查询; 进阶篇:构建、推理; 应用篇:NLP领域、CV领域; 信息篇:TOP团队、感想 一 基础篇 1.1 定义和简史 三元组是知识的最细粒度的表达形式,结构上一般由主语、谓语、宾语组成 阅读全文
posted @ 2020-10-19 12:10 YoungF 阅读(716) 评论(0) 推荐(0)
摘要: Word2Vec是Tomas Mikolov于2013年提出的文本向量化方法12,可以在大量文本语料上通过无监督训练学到词的分布式向量表示。和之前的分布式词向量学习模型相比,Word2Vec的模型不仅简单高效(计算量更少),在词相似度和词类比两个评测任务上都取得了更好的成绩,是一个划时代的作品。 T 阅读全文
posted @ 2020-10-17 00:20 YoungF 阅读(207) 评论(0) 推荐(0)
摘要: 任务介绍 句子的依存结构表达了词与词之间的依赖关系,这种关系称依存关系。它是一种二元的非对称关系(binary asymmetric relation),从依存关系的支配者head指向从属者dependent。 依存句法分析旨在将输入的句子转化成依存分析树(或图),依存树中自上而下任意父子结点之间用 阅读全文
posted @ 2020-10-16 17:32 YoungF 阅读(1514) 评论(0) 推荐(0)
摘要: 回顾Skip-Gram1 Skip-Gram根据中心词来预测上下文词,其损失函数为: \[ \mathcal L_{SG} = \frac{1}{|V|}\sum_{t=1}^{|V|}\sum_{0 \lt |i| \leq c} \log p(w_{t+i}|w_t) \tag 1 \] 其中 阅读全文
posted @ 2020-09-28 01:42 YoungF 阅读(847) 评论(0) 推荐(0)
摘要: 使用dict.fromkeys()创建词典的一个坑 创建词典有三种方法,第一是直接赋值,d = {1:2, 2:3};第二个是,通过构造方法,d = dict([(1, 2), (2, 3)]),第三个就是类方法dict.fromkeys()。 fromkeys(iterable[, value]允 阅读全文
posted @ 2020-08-12 15:16 YoungF 阅读(233) 评论(0) 推荐(0)
摘要: 简介 命名实体识别(Named Entity Recognition, NER)旨在从文本中抽取出命名实体,比如人名、地名、机构名等。它是一个非常重要的基础性任务,可以有效帮助后续的文本语义理解。 NER任务一般有两种类型:flat NER和nested NER。前者就是普通的NER,每个token 阅读全文
posted @ 2020-08-12 00:13 YoungF 阅读(6204) 评论(0) 推荐(1)
摘要: RoBERTa: A Robustly Optimized BERT Pretraining Approach. Yinhan Liu, Myle Ott, Naman Goyal, et al. 2019 BERT提出之后,有很多后续工作XLNet、ALICE、XLM、MT-DNN相继被提出,成绩 阅读全文
posted @ 2020-08-05 00:33 YoungF 阅读(765) 评论(0) 推荐(0)
摘要: Beyond Accuracy: Behavior Testing of NLP Models with CheckList. Marco Tulio Ribeiro, Tongshuang Wu, Carlos Guestrin, Sameer Singh. ACL 2020 摘要 在测试集上评估 阅读全文
posted @ 2020-08-04 00:18 YoungF 阅读(605) 评论(0) 推荐(0)
摘要: 前言 激活函数,是神经网络中实现非线性计算的关键,再深的线性神经网络,本质上都和单步线性计算等价。所以,激活函数这个非线性单元是神经网络化腐朽为神奇的关键。 激活函数的要求: 计算简单,特别是导函数计算简单 连续可导(允许在若干个点上不可导) 值域合理,这样可以尽量使得不同网络层的输入和输出数据相似 阅读全文
posted @ 2020-08-03 00:19 YoungF 阅读(959) 评论(0) 推荐(0)