摘要: 一、两种分词标准: 1. 粗粒度。 将词作为最小基本单位。比如:浙江大学。 主要用于自然语言处理的各种应用。 2. 细粒度。 不仅对词汇继续切分,也对词汇内部的语素进行切分。比如:浙江/大学。 主要用于搜索引擎。一种常用方案是: 索引的时候使用细粒度的分词以保证召回,比如浙江/大学 询的时候使用粗粒 阅读全文
posted @ 2018-10-05 16:56 A_Present 阅读(805) 评论(0) 推荐(0) 编辑