solr中文分词器ik,
推荐资料:http://iamyida.iteye.com/blog/2220474?utm_source=tuicool&utm_medium=referral
使用ik的官方jar包总是有一些问题,个人使用上面博客中共享出来的jar包,
1.将jar包放在solrhome\server\solr-webapp\webapp\WEB-INF\lib下
2.将IKAnalyzer.cfg.xml和stopword.dic copy到solrhome\server\solr-webapp\webapp\WEB-INF\classes下
3.打开schema.xml文件
添加一个类型:
<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index"> <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" /> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" /> <filter class="solr.LowerCaseFilterFactory"/> </analyzer> <analyzer type="query"> <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" /> <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> <filter class="solr.LowerCaseFilterFactory"/> </analyzer> </fieldType>
即可将字段分配为这个类型。
可在后台调试分词器: