2018 年 6月 21 日随笔档案 - nike_ha

2018年6月21日

摘要： 1. 关键词提取 HanLP.extractKeyword(String content, int num); //第一个参数文本内容，第二个参数提取关键词个数 2. 自动摘要 HanLP.extractSummary(String content, int num); //第一个参数文本内容，第二阅读全文

posted @ 2018-06-21 23:22 nike_ha 阅读(1454) 评论(0) 推荐(0) 编辑

HanLP笔记 - 配置分词器

摘要：所有分词器都是 Segment 的子类， Segment 提供以下配置接口：用户可以使用链式语法对Segment执行创建和配置操作，一气呵成: Segment shortestSegment = new ViterbiSegment().enableCustomDictionary(false). 阅读全文

posted @ 2018-06-21 23:14 nike_ha 阅读(1535) 评论(0) 推荐(0) 编辑

HanLP笔记 - 命名实体识别

摘要： 1. 中国人名识别（默认开启）标注为 nr 2. 音译人名识别（默认开启）标注为 nrf 3. 日本人名识别（默认关闭）标注为 nrj 4. 地名识别（默认关闭）标注为 ns 5. 机构名识别（默认关闭）标注为 nt HanLP这五个，基于HMM角色标注的命名实体识别（速度快）阅读全文

posted @ 2018-06-21 23:13 nike_ha 阅读(2590) 评论(0) 推荐(0) 编辑

HanLP笔记 - 分词

摘要： 1. 标准分词 2. NLP分词 3. 索引分词 4. 繁体分词 5. 极速词典分词 6. N-最短路径分词 7. CRF分词详细文档：http://hanlp.linrunsoft.com/doc/_build/html/segment.html 自定义词典第一步： data\dictiona 阅读全文

posted @ 2018-06-21 22:34 nike_ha 阅读(270) 评论(0) 推荐(0) 编辑

nike_ha

公告