文章分类 - solr
摘要:这个从我的简书博客转载的:https://www.jianshu.com/p/c0a3b36f3c58 ##一、背景 前段时间,一连参与了两次客户的Solr问题解决,非常具有参考价值,特别是第二次,网上用Solr的人越来越少,写下总结,希望给使用Solr也遇到类似的问题的朋友一点提示吧。 ##二、M
阅读全文
摘要:由于Solr和ElasticSearch都是基于Lucene构建的,所以他们之间有很大程度的相似性,故而他们的一些优化策略基本也是通用的,面对越来越多的海量数据,如何优化全量索引的写入性能呢? 散仙简单总结了下面几个方向的优化策略,如有疑问,欢迎拍砖。 (一)硬件优化: (1)CPU加大,有利于并发
阅读全文
摘要:转自:http://www.cnblogs.com/herohawk/p/5802439.html 目前我知道Solr建索引有2种方法,这里介绍一下: 第一种就是我们常用的SolrServer.add(Collection<SolrInputDocument>),下面介绍一个各种SolrServer
阅读全文
摘要:DocValues从Lucene4.2和Solr4.2开始加入,通过建立字段的正排索引,提升sorting, faceting, grouping, function queries等性能。 介绍 在Solr的配置文件(schema.xml)中,如果需要为一个Filed建立倒排索引,可以通过配置(i
阅读全文
摘要:什么是docValues? docValues是一种记录doc字段值的一种形式,在例如在结果排序和统计Facet查询时,需要通过docid取字段值的场景下是非常高效的。 为什么要使用docValues? 这种形式比老版本中利用fieldCache来实现正排查找更加高效,更加节省内存。倒排索引将字段内
阅读全文
摘要:版权声明:本文为博主原创文章,未经博主允许不得转载。 版权声明:本文为博主原创文章,未经博主允许不得转载。 一.基本文本分析1.Analyzer在<fieldType>元素内,你应至少定义一个<analyzer>元素决定文本是如何被分析的.实际上,通常定义两个分离的<analyzer>元素,一个用于
阅读全文
摘要:搜索引擎的索引 1.单词——文档矩阵 单词-文档矩阵是表达两者之间所具有的一种包含关系的概念模型,图3-1展示了其含义。图3-1的每列代表一个文档,每行代表一个单词,打对勾的位置代表包含关系。 图3-1 单词-文档矩阵 从纵向即文档这个维度来看,每列代表文档包含了哪些单词,比如文档1包含了词汇1和词
阅读全文
摘要:这篇就说一个信息检索里面理解最简单的一个东西吧,它就叫做倒排表或者倒排索引。但是这只是个名字,我想大家都知道它是什么就行了,不必纠结于名称。先说说倒排表张什么样子吧! 倒排表以词做索引,内容为包含该词的文档编号。对于上图可知,文档1、3、5、7、9包含词"Cat",文档2、5、8、10包含词"Dog
阅读全文
摘要:Shawn Heisey Contents Shawn Heisey Java 8 recommendation for Solr GC Tuning for Solr Why is tuning necessary? G1 (Garbage First) Collector Current exp
阅读全文
摘要:By Timothy Potter on June 3, 2014 By Timothy Potter on June 3, 2014 By Timothy Potter on June 3, 2014 By Timothy Potter on June 3, 2014 SolrCloud is a
阅读全文
该文被密码保护。