上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 42 下一页
摘要: 1.朴素贝叶斯模型(Naive Bayes,NB) 2.最大熵模型(Maximum Entropy Model,MaxEnt 或 MEM) (1)证明Logistic(Softmax)=MaxEnt (2)多项式分布&指数族分布 ①多项分布: ②指数族分布有:高斯/正态分布(Gaussian)、泊松 阅读全文
posted @ 2020-05-22 21:45 西伯尔 阅读(786) 评论(0) 推荐(0) 编辑
摘要: 1.NER简介 (1)单句子标注任务,又叫命名实体识别(Named Entity Recognition),或者“专名识别”,简称NER,是一个序列标注任务。 (2)NER是指识别文本中具有特定意义的实体,包括三大类(实体类,时间类,数字类),七小类(人名P/PER(person),地名A/LOC( 阅读全文
posted @ 2020-05-21 12:15 西伯尔 阅读(1251) 评论(0) 推荐(0) 编辑
摘要: 1.TF-IDF 词频-逆文档频次算法(Term Frequency-Inverse Document Frequency,TF-IDF)是一种统计特征提取算法,评估字或词对于一个文件集或语料库中一份文件的重要程度。 (1)基本思想 重要性与词在整个语料中出现的频次成正比,与出现该词的文档数成反比。 阅读全文
posted @ 2020-05-19 08:52 西伯尔 阅读(261) 评论(0) 推荐(0) 编辑
摘要: 一、信息抽取主要包括三个子任务 1.实体抽取与链指:也就是命名实体识别,NER(Name Entity Recognition) 2.关系抽取:通常我们说的三元组(triple)抽取,主要用于抽取实体间的关系。关系抽取,RE(Relation Extraction) (1) 关系抽取通常在NER之后 阅读全文
posted @ 2020-05-18 07:16 西伯尔 阅读(689) 评论(0) 推荐(0) 编辑
摘要: 本次会议中,Dialog and Interactive Systems 分了三个 section,分别是 Neural Conversation Models, Task-Oriented Dialog, 和 New Task。 1.神经网络对话模型(Neural Conversation Mod 阅读全文
posted @ 2020-05-16 15:46 西伯尔 阅读(390) 评论(0) 推荐(0) 编辑
摘要: 导论 自然语言处理,NLP,接下来的几篇博客将从四方面来展开: (一)基本概念和基础知识 (二)嵌入Embedding (三)Text classification (四)Language Models (五)Seq2seq/Transformer/BERT (六)Expectation-Maxim 阅读全文
posted @ 2020-05-13 16:16 西伯尔 阅读(1815) 评论(0) 推荐(0) 编辑
摘要: 导论 自然语言处理,NLP,接下来的几篇博客将从四方面来展开: (一)基本概念和基础知识 (二)嵌入Embedding (三)Text classification (四)Language Models (五)Seq2seq/Transformer/BERT (六)Expectation-Maxim 阅读全文
posted @ 2020-05-13 16:10 西伯尔 阅读(310) 评论(0) 推荐(0) 编辑
摘要: 导论 自然语言处理,NLP,接下来的几篇博客将从四方面来展开: (一)基本概念和基础知识 (二)嵌入Embedding (三)Text classification (四)Language Models (五)Seq2seq/Transformer/BERT (六)Expectation-Maxim 阅读全文
posted @ 2020-05-13 14:00 西伯尔 阅读(1853) 评论(1) 推荐(0) 编辑
摘要: 导论 自然语言处理,NLP,接下来的几篇博客将从四方面来展开: (一)基本概念和基础知识 (二)嵌入Embedding (三)Text classification (四)Language Models (五)Seq2seq/Transformer/BERT (六)Expectation-Maxim 阅读全文
posted @ 2020-05-12 01:00 西伯尔 阅读(552) 评论(0) 推荐(0) 编辑
摘要: ELMO, BERT, GPT讲解 1.导论 (1)过去计算机怎么读人类文字的? 1-of-N Encoding:每个单词有一个编码,但是这样单词之间没有关联。 Word Class:按照类别分,但是太粗糙了,无法细分。 Word Embedding:向量表示,接近的向量有近似的语义。 (2)一个w 阅读全文
posted @ 2020-05-11 06:43 西伯尔 阅读(277) 评论(0) 推荐(0) 编辑
上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 42 下一页