【solr 基础篇二】中文分析器的配置
1、什么是分析器?
英文(Analyzer),一个分析器可以检查字段的文本信息,并且产生一个token流。分析器是schema.xml中的元素的一个子元素,schema.xml可以在solr/conf目录下找到或者跟solrconfig.xml在同一目录。
通常使用下,只有solr.TextField类型的字段会专门制定一个分析器。最简单配置的一个分析器的方式是使用元素,制定这个元素的class属性为一个完整的java类名。具体过程如下:
2、具体配置
-
1)使用IK-Analyzer,把分析器的文件夹上传到服务器
- 2)把文件夹中的jar包添加到solr工程中
[root@localhost ~/IK Analyzer 2012FF_hf1]#cp IKAnalyzer2012FF_u1.jar /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib/
- 3)把IK-Analyzer需要的扩展词典及停用词词典,配置文件复制到colr工程的classpath
[root@localhost ~/IK Analyzer 2012FF_hf1]#cp IKAnalyzer.cfg.xml ext_stopword.dic mydict.dic /usr/local/solr/tomcat/webapps/solr/WEB-INF/classes/
注:扩展词典及停用词词典集必须是UTF-8 -
4)配置fieldType.需要在/usr/local/solr/solrhome/collection1/conf/schema.xml中配置
分析器配置完工之后,我们可以根据业务场景对业务字段进行配置
3、业务字段的配置
判断标准:
- 在搜索时是否需要在此字段上进行搜索 eg:姓名,描述等字段
- 后续的业务是否需要用到此字段 eg:商品Id
依旧是在schema.xml中进行配置:
最后字段添加完之后的效果图: