elasticsearch中文分词
前言
首先来一篇大神的文章: https://blog.csdn.net/qq_26803795/article/details/106522611 这篇文章已经介绍的比较清楚了,我看完之后还是有一些小小的疑惑。
总结
首先总结一下实现中文分词关键点:
在elasticsearch的配置文件elasticsearch.yml中配置默认的分词器
index.analysis.analyzer.default.type: ik
创建index的时候在mappings中对应的字段里指定中文分词器
我的疑问
如果配置文件中没有配置默认分词器,建立index的时候也没有对相应的字段指定中文分词器,但是在查询的时候指定分词器,这个时候中文分词能成功吗?
答:不会成功,其实理解了es的检索原理之后,应该很容易能想明白这一点。如果在数据插入之前没有指定分词器,那么建立索引的时候就会使用默认的分词器。正确的分词将不会被建立索引。