摘要: jieba(结巴)是一个强大的分词库,完美支持中文分词 一、 结巴分词分为三种模式:精确模式(默认)、全模式和搜索引擎模式 精确模式:试图将句子最精确地切开,适合文本分析; 全模式:把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; 搜索引擎模式:在精确模式的基础上,对长词再次 阅读全文
posted @ 2019-04-02 21:31 Coylin 阅读(357) 评论(0) 推荐(0) 编辑