solr5.5+中文分词 - 海水中的泪

公告

solr5.5+中文分词

首先，solr5.5自带的中文分词实在是太low了。

无奈。

采用ik来试试。

首先，下载ik。地址https://github.com/EugenePig/ik-analyzer-solr5

下载完成后解压

在解压目录打开命令行窗口：mvn clean install

等着完成就可以了。

至此，打包完成。

编译结果如下：

拷贝ik-analyzer-solr5-5.x.jar 到solr5.5目录（F:\work1\tools\tomcat-8.0.32\webapps\solr\WEB-INF\lib）

下一步就是配置了：

如果你的core目录中没有schema.xml ,那么修改managed-schema文件是一样的，添加以下配置：

<fieldType name="text_ik" class="solr.TextField">
        <analyzer type="index" useSmart="false"
            class="org.wltea.analyzer.lucene.IKAnalyzer" />
        <analyzer type="query" useSmart="true"
            class="org.wltea.analyzer.lucene.IKAnalyzer" />
</fieldType>

然后重新启动solr5.5

测试：

结束。

另：关于ik的智能分词

配置須采用如下设置：

<fieldType name="text_ik" class="solr.TextField">   
    <analyzer type="index">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" />
    </analyzer>
    <analyzer type="query">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" />
    </analyzer>
  </fieldType>

之前的设置无法实现智能分词，及useSmart设置无效。

posted on 2016-05-03 21:56 海水中的泪阅读(1808) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部