Solr的缓存体系

--lvpei.cnblogs.com 翻译自http://wiki.apache.org/solr/SolrCaching ,翻译的很差,不如看原版。

 

Solr缓存与Solr的索引搜索器(SolrIndexSearcher)息息相关的,而众所周知,索引的结构很难做出大的变动,效率也是板上钉钉的事情。因此提高索引搜索器的使用效率,使之在任何缓存都能够高效并可重用是目前需要我们去做的工作。在Solr中所提到的缓存和我们平常遇到的缓存不同。在Solr中的缓存对象将不会在一段时间之后过期,也就是说,只要索引搜索器是存在的,那么高速缓存对象也一定存在。

满足索引搜索服务的要求,并在一个新的搜索被打开,新的自动后台预热,原来的那个搜索器然满足对外服务的要求。新的搜索器就绪时,它将作为当前搜索被注册,并将处理以后新的搜索请求。而旧的搜索器在把它当前所有搜索请求完成后,将会关闭。当前新的搜索器被做为自动预热的根源。在打开一个新的搜索者时其高速缓存可能会预先设定或者自动预热,并使用旧的搜索器的数据缓存。目前有两种缓存实现 — — solr.search.LRUCache (LRU = 最近最少使用内存中),和 solr.search.FastLRUCache

常见的缓存配置参数

class

您想要使用、 可实现的 SolrCache 实现的 

solr.search.LRUCache 

solr.search.FastLRUCache 

size

最大高速缓存中的条目数。initialSize

autowarmCount

从旧的缓存中需要预热的缓存对象数量。在打开一个新的搜索器时其高速缓存可能会从缓存中旧的搜索器所属的缓存对象预设或者"autowarmed"autowarmCount 是将新的搜索在重新生成的缓存条目数。现在可以将 autowarmCount 指定为百分比 (即: 90%) 可计算相对现有缓存中的项的数目。

Types of Caches and Example Configuration

FilterCache

过滤器缓存(filterCache)存储无序的文档编号列表。此缓存有三个不同的目的:

1、 过滤器缓存存储任何solr明确要求执行过滤查询结果(fq参数)。每个过滤器和缓存分别执行。闲暇时用它来限制查询所返回结果的数量.

2、 过滤器缓存是用于在某些情况下,小面。 (特别是,当TermEnum方法是使用一个filterCache项为每个测试项补充说。)

3、 过滤器缓存可能被用来进行排序,如果<useFilterForSortedQuery/>配置选项设置为truesolfconfig.xml

如果使用fieldCache的方法,建议设置filterCache大小比例。

QueryResultCache

此缓存中存储的文档 id,是按某些条件查询结果排序的有序的集。

在 queryResultCache 的内存使用情况明显小于在 filterCache ,因为它只存储文档由查询返回给用户的 id

DocumentCache

存储在documentCache从磁盘中提取的Lucene的文对象。越是字段存储在磁盘上,这种缓存的内存使用量越高。

User/Generic Caches

用户/通用缓存,通过SolrIndexSearcher.getCache(),cacheLookup(),目的是使用户/应用程序级数据的简单缓存。参数应指定为实现solr.search.CacheRegenerator

Lucene FieldCache

Lucene 具有一个低级别"字段 缓存",用于进行排序 (和在某些情况下 faceting)。 

posted @ 2010-06-04 13:47  abstractwind  阅读(2155)  评论(0编辑  收藏  举报