摘要: HanLP二元核心词典解析 本文分析:HanLP版本1.5.3中二元核心词典的存储与查找。当词典文件没有被缓存时,会从文本文件CoreNatureDictionary.ngram.txt中解析出来存储到TreeMap中,然后构造start和pair数组,并基于这两个数组实现词共现频率的二分查找。当已 阅读全文
posted @ 2018-05-08 21:52 大熊猫同学 阅读(1879) 评论(0) 推荐(1) 编辑