Solr 集成ikanalyzer

Solr 不能对中文进行分词,ikanalyzer可以。

ikanalyzer下载链接

1.下载 jar形式

2.放到D:\soft\solr-8.1.0\server\solr-webapp\webapp\WEB-INF\lib路径下

3.在路径D:\soft\solr-8.1.0\server\solr下,新建一个mycore

4. 复制 路径D:\soft\solr-8.1.0\example\example-DIH\solr\solr下所有文件,放到D:\soft\solr-8.1.0\server\solr\mycore

5.找到D:\soft\solr-8.1.0\server\solr\mycore\conf 路径下的managed-schema文件,打开,加入下面的代码

<!-- ik分词器 -->
	<fieldType name="text_ik" class="solr.TextField">
	  <analyzer type="index">
		  <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
		  <filter class="solr.LowerCaseFilterFactory"/>
	  </analyzer>
	  <analyzer type="query">
		  <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
		  <filter class="solr.LowerCaseFilterFactory"/>
	  </analyzer>
	</fieldType>

6.重启solr solr restart -p 8983 ,浏览器 输入 : http://localhost:8983

7.自定义分词索引

7.1 在路径D:\soft\solr-8.1.0\server\solr-webapp\webapp\WEB-INF下,新建classes文件。

7.2 解压 ik-analyzer-solr7-7.x.jar ,复制 ext.dic,IKAnalyzer.cfg.xml,stopword.dic 这三个文件。

7.3 将上面复制的三个文件放到classes里。

8.对比测试 在ext.dic文件里加上一个索引: 黑夜给了我黑色的眼睛,

然后重启solr solr restart -p 8983 ,浏览器 输入 : http://localhost:8983

参考文章 : solr7.3 环境搭建 配置中文分词器 ik-analyzer-solr7 详细步骤

posted @ 2019-05-15 09:46  lick  阅读(1575)  评论(0编辑  收藏  举报