摘要: pyhanlp中的命名实体识别对于分词而言,命名实体识别是一项非常重要的功能,当然发现新词同样重要(这部分内容被我放在之后的“提取关键词、短语提取与自动摘要、新词识别”与再之后的案例中了。首先是一个简单的例子,展示一下命名实体识别的效果。之后是正式内容:简单... 阅读全文
posted @ 2018-09-20 21:54 FontTian 阅读(2544) 评论(0) 推荐(0) 编辑
摘要: hanlp的词典模式之前我们看了hanlp的词性标注,现在我们就要使用自定义词典与停用词功能了,首先关于HanLP的词性标注方式具体请看HanLP词性标注集。其核心词典形式如下:自定义词典自定义词典有多种添加模式,首先是展示的一个小例子,展示了词汇的动态增加... 阅读全文
posted @ 2018-09-20 21:35 FontTian 阅读(1477) 评论(0) 推荐(0) 编辑
摘要: pyhanlp中的分词器简介pyhanlp实现的分词器有很多,同时pyhanlp获取hanlp中分词器也有两种方式第一种是直接从封装好的hanlp类中获取,这种获取方式一共可以获取五种分词器,而现在默认的就是第一种维特比分词器维特比 (viterbi):效率... 阅读全文
posted @ 2018-09-20 19:36 FontTian 阅读(3303) 评论(0) 推荐(0) 编辑