上一页 1 ··· 23 24 25 26 27 28 29 30 31 ··· 50 下一页

2019年9月2日

分词工具pyltp的使用

摘要: pyltp的简介 语言技术平台(LTP)经过哈工大社会计算与信息检索研究中心 11 年的持续研发和推广, 是国内外最具影响力的中文处理基础平台。它提供的功能包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等。 语言技术平台架构 pyltp 是 LTP 的 Python 封装,同时支持 阅读全文

posted @ 2019-09-02 15:36 农夫三拳有點疼 阅读(825) 评论(0) 推荐(0) 编辑

NLP用深度学习实现命名实体识别(NER)

该文被密码保护。 阅读全文

posted @ 2019-09-02 15:33 农夫三拳有點疼 阅读(3) 评论(0) 推荐(0) 编辑

NLP命名实体识别(NER)

摘要: 本文将会简单介绍自然语言处理(NLP)中的命名实体识别(NER)。 常见算法如下: 命名实体识别(Named Entity Recognition,简称NER)是信息提取、问答系统、句法分析、机器翻译等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要地位。一般来说,命名实体识别的 阅读全文

posted @ 2019-09-02 15:30 农夫三拳有點疼 阅读(1749) 评论(0) 推荐(0) 编辑

NLP词形还原(Lemmatization)

摘要: 词形还原(Lemmatization)是文本预处理中的重要部分,与词干提取(stemming)很相似。 简单说来,词形还原就是去掉单词的词缀,提取单词的主干部分,通常提取后的单词会是字典中的单词,不同于词干提取(stemming),提取后的单词不一定会出现在单词中。比如,单词“cars”词形还原后的 阅读全文

posted @ 2019-09-02 15:25 农夫三拳有點疼 阅读(410) 评论(0) 推荐(0) 编辑

NLP探究TF-IDF的原理

摘要: TF-IDF介绍 TF-IDF是NLP中一种常用的统计方法,用以评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度,通常用于提取文本的特征,即关键词。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。 在NLP中,TF-IDF的计算公式如下: 阅读全文

posted @ 2019-09-02 15:22 农夫三拳有點疼 阅读(477) 评论(0) 推荐(0) 编辑

上一页 1 ··· 23 24 25 26 27 28 29 30 31 ··· 50 下一页

导航