Apache Lucene 4.1 发布,Java 搜索框架

Apache Lucene 4.1 发布了,包含一些 bug 修复、优化和提升,值得关注的有:

  • Lucene 4.1 使用新的默认编码器 (Lucene41Codec) 基于前一个体验的 “Block” 索引格式,用于提升性能,提供提供追加和 Pulsing 操作
  • 默认的编码器优化了索引的存储,如果只有一个文档包含某个 Term ,则直接在 Term 字典中存储文档 id,而不是在独立的文件中存储文档id
  • 默认编码器实现了高校的压缩存储字段的实现,使用 LZ4 进行压缩(详情
  • 写文件时采用追加方式,不再进行搜索操作
  • 新的 suggest实现 —— AnalyzingSuggester(详情
  • facet 模块实现近乎实时的搜索支持
  • 全新的 Highlighter (postingshighlighter) (详情
  • 增加 FilterStrategy 到 FilteredQuery 实现更灵活的过滤查询执行
  • 添加 CommonTermsQuery用于加速高频 Term 的查询速度,Term 的频度可在查询时间高效的检测,无需耗费索引准备时间
  • 4.0 的 bug 修复和其他的优化

更完整的列表请下载后查看 CHANGES.txt 文件。

posted @ 2013-02-02 15:50  Hongten  阅读(358)  评论(0编辑  收藏  举报
Fork me on GitHub