solr中文分词器ik,

  推荐资料:http://iamyida.iteye.com/blog/2220474?utm_source=tuicool&utm_medium=referral

  使用ik的官方jar包总是有一些问题,个人使用上面博客中共享出来的jar包,

  1.将jar包放在solrhome\server\solr-webapp\webapp\WEB-INF\lib下

  2.将IKAnalyzer.cfg.xml和stopword.dic copy到solrhome\server\solr-webapp\webapp\WEB-INF\classes下

  

  3.打开schema.xml文件

    添加一个类型:

  

<fieldType name="text_ik" class="solr.TextField">
        <analyzer type="index">           
            <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory"  />
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                <filter class="solr.LowerCaseFilterFactory"/>
        </analyzer>
        <analyzer type="query">
            <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory"/>
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
                <filter class="solr.LowerCaseFilterFactory"/>
        </analyzer>   
    </fieldType>

      即可将字段分配为这个类型。

 

  可在后台调试分词器:

  

 

posted on 2016-03-08 16:02  大招无限  阅读(1120)  评论(0编辑  收藏  举报