【solr 基础篇二】中文分析器的配置

1、什么是分析器？

英文（Analyzer），一个分析器可以检查字段的文本信息，并且产生一个token流。分析器是schema.xml中的元素的一个子元素，schema.xml可以在solr/conf目录下找到或者跟solrconfig.xml在同一目录。
通常使用下，只有solr.TextField类型的字段会专门制定一个分析器。最简单配置的一个分析器的方式是使用元素，制定这个元素的class属性为一个完整的java类名。具体过程如下：

2、具体配置

1）使用IK-Analyzer，把分析器的文件夹上传到服务器: 2）把文件夹中的jar包添加到solr工程中
[root@localhost ~/IK Analyzer 2012FF_hf1]#cp IKAnalyzer2012FF_u1.jar /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib/; 3）把IK-Analyzer需要的扩展词典及停用词词典，配置文件复制到colr工程的classpath
[root@localhost ~/IK Analyzer 2012FF_hf1]#cp IKAnalyzer.cfg.xml ext_stopword.dic mydict.dic /usr/local/solr/tomcat/webapps/solr/WEB-INF/classes/
注：扩展词典及停用词词典集必须是UTF-8; 4）配置fieldType.需要在/usr/local/solr/solrhome/collection1/conf/schema.xml中配置

分析器配置完工之后，我们可以根据业务场景对业务字段进行配置

3、业务字段的配置

判断标准：
- 在搜索时是否需要在此字段上进行搜索 eg:姓名，描述等字段
- 后续的业务是否需要用到此字段 eg:商品Id
依旧是在schema.xml中进行配置：
业务字段配置
最后字段添加完之后的效果图：
FieldType字段显示

posted on 2016-07-25 17:19 huohuoL 阅读(104) 评论(0) 编辑收藏举报

刷新页面返回顶部

【solr 基础篇二】中文分析器的配置

1、什么是分析器？

2、具体配置

3、业务字段的配置

导航

公告