2009年11月20日
摘要: http://incubator.apache.org/lucene.net/http://space.cnblogs.com/group/topic/4683/http://www.cnblogs.com/idior/category/21216.html 阅读全文
posted @ 2009-11-20 00:42 上午的绝缘杯 阅读(460) 评论(0) 推荐(0) 编辑
摘要: 1lucene简介1.1什么是luceneLucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com或者googleDesktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。1.2lucene能做什么要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,说到底,就是你给它若干个字符串,然后它为你提供一个全文搜索服务,告诉你你要搜索的关键... 阅读全文
posted @ 2009-11-20 00:39 上午的绝缘杯 阅读(1025) 评论(1) 推荐(0) 编辑
摘要: Lucene中文分析器的中文分词准确性和性能比较 作者: approximation 对几种中文分析器,从分词准确性和效率两方面进行比较。分析器依次为:StandardAnalyzer、ChineseAnalyzer、 CJKAnalyzer、IK_CAnalyzer、MIK_CAnalyzer、MMAnalyzer(JE分词)、PaodingAnalyzer。单纯的中文分词的实现一般为按字索引或... 阅读全文
posted @ 2009-11-20 00:34 上午的绝缘杯 阅读(1110) 评论(0) 推荐(0) 编辑