古越剑箫

学习是一种习惯

  :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: :: 管理 ::

1、solr自带的分词器远远满足不了中文分词的需求,经查使用最多的分词器是solr是mmseg4j分词器,具体整合大家可以参考

https://github.com/zhuomingliang/mmseg4j

一定要注意版本

2、将这两个包直接拷贝到tomcat下的solr/lib中

 

3、在solr/java里新建dic目录将词库拷贝进去

 4、直接在浏览器http://127.0.0.1:8080/solr即可如下分词结果

 

 

 

ok,分词整合完毕!

 

posted on 2016-09-30 22:23  古越剑箫  阅读(858)  评论(0编辑  收藏  举报