海水中的泪

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

首先,solr5.5自带的中文分词实在是太low了。

无奈。

采用ik来试试。

首先,下载ik。地址https://github.com/EugenePig/ik-analyzer-solr5

下载完成后解压

在解压目录打开命令行窗口:mvn clean install 

 等着完成就可以了。

至此,打包完成。

编译结果如下:

 

拷贝ik-analyzer-solr5-5.x.jar 到solr5.5目录(F:\work1\tools\tomcat-8.0.32\webapps\solr\WEB-INF\lib)

下一步就是配置了:

如果你的core目录中没有schema.xml ,那么修改managed-schema文件是一样的,添加以下配置:

<fieldType name="text_ik" class="solr.TextField">
        <analyzer type="index" useSmart="false"
            class="org.wltea.analyzer.lucene.IKAnalyzer" />
        <analyzer type="query" useSmart="true"
            class="org.wltea.analyzer.lucene.IKAnalyzer" />
</fieldType>

然后重新启动solr5.5

测试:

结束。

另:关于ik的智能分词

配置須采用如下设置:

<fieldType name="text_ik" class="solr.TextField">   
    <analyzer type="index">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" />
    </analyzer>
    <analyzer type="query">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" />
    </analyzer>
  </fieldType>

之前的设置无法实现智能分词,及useSmart设置无效。

posted on 2016-05-03 21:56  海水中的泪  阅读(1808)  评论(0编辑  收藏  举报