[solr] - IKAnalyzer 扩展分词库
在solr中加入自己的扩展分词库方法:
参考文章:
http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html
1、在solr的web中:\WEB-INF目录下新增一个文件夹:classes
2、新增一个文件:IKAnalyzer.cfg.xml
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"> <properties> <comment>IK Analyzer 扩展配置</comment> <!--用户可以在这里配置自己的扩展字典--> <entry key="ext_dict">my.dic;</entry> <!--用户可以在这里配置自己的扩展停止词字典--> <entry key="ext_stopwords">stopword.dic;</entry> </properties>
说明:
my.dic即为扩展分词库,分词库可以为多个,以分号隔开即可。停止词库一样。
3、新增my.dic文件。文件格式必需是:无BOM的UTF-8格式,示例内容为:
西丽
4、保存,重启solr。
使用了新的分词,需要重新建索引数据。
5、测试: