什么是solr?
solr是一个独立的企业级搜索应用服务器,对外提供类似web-service的API接口。是一个高性能,基于Lucene(开源搜索引擎框架)的全文搜索服务器。实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。
全文检索是指是计算机索引程序扫描文章中的每一个词,对每个词都建立索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的检索进行查找,并将查找结果返回给用户。
工作方式:
文档通过Http利用XML加到一个搜索集合中,查询该集合也是通过HTTP收到一个XML/JSON响应来实现。主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供一套强大的Data Schema来定义字段、类型和设置文本分析,提供基于Web的管理界面。
存储资源是以Document为对象进行存储的。每个文档由一系列的Field构成,每个Field表示资源的一个属性。solr中每个Document需要有能唯一标识其自身的属性,默认情况下这个属性的名字是id。
使用对比:
1、Solr VS Lucene
Lucene是一个全文检索引擎工具包,它只是一个jar包,不能独立运行,对外提供服务。
Solr是一个全文检索服务器,它可以单独运行在servlet容器,可以单独对外提供搜索和索引功能。Solr比lucene在开发全文检索功能时,更快捷、更方便。
2、Solr VS ElasticSearch
ElasticSearch是一个实施的分布式搜索和分析引擎,完全支持Apache Lucene的接近实时的搜索。而Solr建立索引后,实时索引搜索效率下降。但是在不建索引的情况下,Solr的搜索效率明显高于ElasticSearch。
ElasticSearch处理多租户不需要特殊配置,而Solr则需要更多的高级设置。
Solr支持多种格式的数据,ElasticSearch仅支持json文件格式。