2018 年 12月 3 日随笔档案 - 左手中倒影

2018年12月3日

HanLP二元核心词典详细解析

摘要：本文分析：HanLP版本1.5.3中二元核心词典的存储与查找。当词典文件没有被缓存时，会从文本文件CoreNatureDictionary.ngram.txt中解析出来存储到TreeMap中，然后构造start和pair数组，并基于这两个数组实现词共现频率的二分查找。当已经有缓存bin文件时，那直接读取构建start和pair数组，速度超快。阅读全文

posted @ 2018-12-03 09:53 左手中倒影阅读(210) 评论(0) 推荐(0) 编辑

左手中倒影

公告

HanLP二元核心词典详细解析