摘要: 对几种中文分析器,从分词准确性和效率两方面进行比较。分析器依次为:StandardAnalyzer、ChineseAnalyzer、CJKAnalyzer、IK_CAnalyzer、MIK_CAnalyzer、MMAnalyzer(JE分词)、PaodingAnalyzer。单纯的中文分词的实现一般... 阅读全文
posted @ 2014-04-17 10:11 Sonet 阅读(431) 评论(0) 推荐(0) 编辑
摘要: 搜索排序结果的控制 Lucnen作为搜索引擎中,应用最为广泛和成功的开源框架,它对搜索结果的排序,有一套十分完整的机制来控制;但我们控制搜索结果排序的目的永远只有一个,那就是信息过滤,让用户快速,准确的找到其想要的结果,丰富用户体验。以前看过一个牛人的博客,总结了4个地方,可对Lucene检索结果的... 阅读全文
posted @ 2014-04-17 10:09 Sonet 阅读(485) 评论(0) 推荐(0) 编辑