摘要: 这篇文章主要是记录HanLP标准分词算法整个实现流程。 HanLP的核心词典训练自人民日报2014语料,语料不是完美的,总会存在一些错误。这些错误可能会导致分词出现奇怪的结果,这时请打开调试模式排查问题: 那什么是语料呢?通俗的理解,就是HanLP里面的二个核心词典。假设收集了人民日报若干篇文档,通 阅读全文
posted @ 2019-07-27 15:01 大熊猫同学 阅读(7025) 评论(0) 推荐(0) 编辑