上一页 1 ··· 22 23 24 25 26 27 28 29 30 ··· 50 下一页

2019年9月2日

NLP—三种中文分词工具

摘要: 本文将对三种中文分词工具进行使用尝试,这三种工具分别为哈工大的LTP,结巴分词以及北大的pkuseg。 首先我们先准备好环境,即需要安装三个模块:pyltp, jieba, pkuseg以及LTP的分词模型文件cws.model。在用户字典中添加以下5个词语: 经 少安 贺凤英 F-35战斗机 埃达 阅读全文

posted @ 2019-09-02 16:07 农夫三拳有點疼 阅读(1523) 评论(0) 推荐(0) 编辑

文本情感分析

摘要: 一、情感分析简介 文本情感分析(Sentiment Analysis)是自然语言处理(NLP)方法中常见的应用,也是一个有趣的基本任务,尤其是以提炼文本情绪内容为目的的分类。它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。 本文将介绍情感分析中的情感极性(倾向)分析。所谓情感极性分析 阅读全文

posted @ 2019-09-02 15:51 农夫三拳有點疼 阅读(3396) 评论(3) 推荐(1) 编辑

NLP—词义消岐(WSD)的简介与实现

摘要: 一、词义消岐简介 词义消岐,英文名称为Word Sense Disambiguation,英语缩写为WSD,是自然语言处理(NLP)中一个非常有趣的基本任务。 那么,什么是词义消岐呢?通常,在我们的自然语言中,不管是英语,还是中文,都有多义词存在。这些多义词的存在,会让人对句子的意思产生混淆,但人通 阅读全文

posted @ 2019-09-02 15:42 农夫三拳有點疼 阅读(580) 评论(0) 推荐(0) 编辑

CRF++实现命名实体识别(NER)

摘要: 一、CRF与NER简介 CRF,英文全称为conditional random field, 中文名为条件随机场,是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔可夫(Markov)随机场。 较为简单的条件随机场是定义在线性链上的条件随机场,称为线性 阅读全文

posted @ 2019-09-02 15:40 农夫三拳有點疼 阅读(650) 评论(0) 推荐(0) 编辑

NLP—中文预处理之繁简体转换及获取拼音

摘要: 在日常的中文NLP中,经常会涉及到中文的繁简体转换以及拼音的标注等问题,本文将介绍这两个方面的实现。 首先是中文的繁简体转换,不需要使用额外的Python模块,至需要以下两个Python代码文件即可: langconv.py 地址: https://raw.githubusercontent.com 阅读全文

posted @ 2019-09-02 15:39 农夫三拳有點疼 阅读(527) 评论(0) 推荐(0) 编辑

上一页 1 ··· 22 23 24 25 26 27 28 29 30 ··· 50 下一页

导航