2015年1月5日

IKanalyzer、ansj_seg、jcseg三种中文分词器的实战较量

摘要: 选手:IKanalyzer、ansj_seg、jcseg硬件:i5-3470 3.2GHz 8GB win7 x64比赛项目:1、搜索;2、自然语言分析选手介绍: 1,IKanalyzer IKanalyzer采用的是“正向迭代最细粒度切分算法”,是比较常见而且很容易上手的分词器了。一般新手上路... 阅读全文

posted @ 2015-01-05 15:44 lies_joker 阅读(6447) 评论(0) 推荐(0) 编辑

2014年7月18日

solrcloud和zookeeper的搭建、使用、心得、教训

摘要: 公司的solr线上服务器,分成差不多10个core给不同的部门不同的业务需求来使用。我接手以来,问题多多,烦扰多多。有不少问题亟待解决,首当其冲的是搜索准确度、数据同步。搜索准确度已经通过改用ansj分词器和不断优化的个人词库和停用词库来解决,这是个不断优化的过程,需要长时间的跟进才有明显效果... 阅读全文

posted @ 2014-07-18 18:16 lies_joker 阅读(1428) 评论(0) 推荐(0) 编辑

2014年7月11日

新版搜索日志记录-持续更新

摘要: 在本人工作期间,会不断更新优化公司的搜索!2014年7月18日,搜索新特性:zookeeper和solrcloud的加入,令人兴奋!solr索引core新的创建方式,不再需要重启solr服务solr多机器数据的同步和更新更快的搜索响应速度搜索性能自动负载,为将来可能扩展搜索机器预留接口敏感词搜索优化... 阅读全文

posted @ 2014-07-11 16:05 lies_joker 阅读(388) 评论(0) 推荐(0) 编辑

solr4.8的安装,配置,使用,搜索,推荐及看法

摘要: solr4.9发布了,用一个网友的意思,现在solr绝壁是Firefox之外最大的版本帝。公司的solr版本是4.0,这几天决定给升级到4.8(4.9在maven上资源还不够),抽时间在整理下分布式solr. 今天先把solr4.8安装过程写下来,其实和4.0区别不大。1,环境必须是tomcat7... 阅读全文

posted @ 2014-07-11 15:44 lies_joker 阅读(494) 评论(0) 推荐(0) 编辑

导航