摘要:
经过了三年的开发努力,Apache Solr Server 4.0终于发布了。Apache Solr是流行的,速度极快,开源的NoSQL的搜索平台,来自于Apache Lucene项目。它的主要功能包括强大的全文搜索,命中高亮显示、面搜索、动态集群、数据库集成、丰富的文档和地理信息搜索。Solr是高度可扩展的、提供了分布式搜索和索引的容错功能,强大的搜索和导航功能等。Apache Solr 4.0版的亮点:1. 重新设计了分布式索引,拥有NRT(near real-time)和NoSQL特性。2. 高可用性且无单点故障。3. 可与Apache Zookeeper集成,分布式协调和集群元数据和配 阅读全文
摘要:
经过了三年的开发努力,Apache Lucene 4.0终于发布了。Apache Lucene是一个高性能,全功能的文本搜索引擎库,完全用Java编写的。这是一个技术适用于几乎任何需要全文搜索,特别是跨平台的应用程序。Apache Lucene 4.0版的亮点:1. 索引格式支持条目、邮件列表、数据库存储的字段、条目矢量等格式,通过编码器API实现了可插拔。可以选择或自定义索引格式。2. 矢量空间模型的相似度解耦(TF-IDF)。有附加模型(如BM25)、随机偏离、语言模型、基于信息的模型等。3. IndexWriter支持并行写磁盘,适用于应用程序使用多线程建立索引的场景。4. 每个文档的归 阅读全文