[solr] - IKAnalyzer 分词加入

IKAnalyzer分词是一个开源的，基于java语言开发的轻量级的中文分词工具包。IKAnalyzer采用“正向迭代最细粒度切分算法”，支持细粒度和智能分词两种模式。支持用户字典扩展定义，不过对中英文混合词的分割没有特别好的支持。

1、下载IKAnalyzer中文分词器http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip

2、解压出zip文件，将IKAnalyzer2012FF_u1.jar复制到tomcat中的solr\WEB-INF\lib目录中

3、在tomcat的solr\WEB-INF目录中，新建一个classes文件夹，将解压出的zip文件中的IKAnalyzer.cfg.xml和stopword.dic复制到classes中

4、用记事本打开E:\solrhome\5.2.1\core0\conf\schema.xml文件，加入这句话到<schema/>节点内：

<fieldType name="text_cn" class="solr.TextField">
        <analyzer type="index" class="org.wltea.analyzer.lucene.IKAnalyzer" />
        <analyzer type="query" class="org.wltea.analyzer.lucene.IKAnalyzer" />
</fieldType>

<field name="subject" type="text_cn" indexed="true" stored="true" />
<field name="content" type="text_cn" indexed="true" stored="true" />

5、启动或重启tomcat

6、进入http://localhost:8082/solr5.2.1/#/core1/analysis，输入“我是中国人，我来自张家界”。

posted @ 2015-08-27 14:50 liuming_1992 阅读(250) 评论(0) 收藏举报

刷新页面返回顶部

liuming_1992

[solr] - IKAnalyzer 分词加入

公告