solr 中文分词 IKAnalyzer - 大招无限

公告

solr 中文分词 IKAnalyzer

solr中文分词器ik，

　　推荐资料：http://iamyida.iteye.com/blog/2220474?utm_source=tuicool&utm_medium=referral

　　使用ik的官方jar包总是有一些问题，个人使用上面博客中共享出来的jar包，

　　1.将jar包放在solrhome\server\solr-webapp\webapp\WEB-INF\lib下

　　2.将IKAnalyzer.cfg.xml和stopword.dic copy到solrhome\server\solr-webapp\webapp\WEB-INF\classes下

　　3.打开schema.xml文件

　　　　添加一个类型：

<fieldType name="text_ik" class="solr.TextField">
        <analyzer type="index">           
            <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory"  />
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                <filter class="solr.LowerCaseFilterFactory"/>
        </analyzer>
        <analyzer type="query">
            <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory"/>
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
                <filter class="solr.LowerCaseFilterFactory"/>
        </analyzer>   
    </fieldType>

即可将字段分配为这个类型。

　　可在后台调试分词器：

posted on 2016-03-08 16:02 大招无限阅读(1134) 评论(0) 收藏举报

刷新页面返回顶部