【solr 基础篇二】中文分析器的配置

1、什么是分析器?

英文(Analyzer),一个分析器可以检查字段的文本信息,并且产生一个token流。分析器是schema.xml中的元素的一个子元素,schema.xml可以在solr/conf目录下找到或者跟solrconfig.xml在同一目录。
通常使用下,只有solr.TextField类型的字段会专门制定一个分析器。最简单配置的一个分析器的方式是使用元素,制定这个元素的class属性为一个完整的java类名。具体过程如下:

2、具体配置

    1)使用IK-Analyzer,把分析器的文件夹上传到服务器
2)把文件夹中的jar包添加到solr工程中
[root@localhost ~/IK Analyzer 2012FF_hf1]#cp IKAnalyzer2012FF_u1.jar /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib/
3)把IK-Analyzer需要的扩展词典及停用词词典,配置文件复制到colr工程的classpath
[root@localhost ~/IK Analyzer 2012FF_hf1]#cp IKAnalyzer.cfg.xml ext_stopword.dic mydict.dic /usr/local/solr/tomcat/webapps/solr/WEB-INF/classes/
:扩展词典及停用词词典集必须是UTF-8

4)配置fieldType.需要在/usr/local/solr/solrhome/collection1/conf/schema.xml中配置
fieldType配置

分析器配置完工之后,我们可以根据业务场景对业务字段进行配置

3、业务字段的配置

判断标准:
- 在搜索时是否需要在此字段上进行搜索 eg:姓名,描述等字段
- 后续的业务是否需要用到此字段 eg:商品Id
依旧是在schema.xml中进行配置:
业务字段配置
最后字段添加完之后的效果图:
FieldType字段显示

posted on 2016-07-25 17:19  huohuoL  阅读(102)  评论(0编辑  收藏  举报

导航