陋室铭
永远也不要停下学习的脚步(大道至简至易)

posts - 2169,comments - 570,views - 413万

随笔分类 -  搜索引擎

上一页 1 2 3 4 5 6 ··· 8 下一页
solr StatsComponent(聚合统计)
摘要:一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询,也就是min、max、avg、count、sum的功能。 二、参数 参数 含义 stats 是否开启stats(true/false) stats.field 添加一个字段来统计,可以有多个 stats.facet 在 阅读全文
posted @ 2020-03-24 19:18 宏宇 阅读(555) 评论(0) 推荐(0) 编辑
solr配置同义词,停止词,和扩展词库(IK分词器为例)
摘要:定义 同义词:搜索结果里出现的同义词。如我们输入”还行”,得到的结果包括同义词”还可以”。 停止词:在搜索时不用出现在结果里的词。比如is 、a 、are 、”的”,“得”,“我” 等,这些词会在句子中多次出现却无意义,所以在分词的时候需要把这些词过滤掉。 扩展词:在搜索结果里额外出现的词。扩展词只 阅读全文
posted @ 2019-10-13 12:36 宏宇 阅读(994) 评论(0) 推荐(0) 编辑
Solr 数字字符不能搜索的一个问题
摘要:问题一: 测试人员告诉我数字不能被搜索。于是开始找原因:<fields>***<field name="productName" type="text" indexed="true" stored="true" />***</fields>fieldType text配置:<fieldType na 阅读全文
posted @ 2019-10-13 12:31 宏宇 阅读(322) 评论(0) 推荐(0) 编辑
solr添加中文IK分词器,以及配置自定义词库
摘要:Solr是一个基于Lucene的Java搜索引擎服务器。Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括 XML/XSLT 和 JSON 格式)。它易于安装和配置,而且附带了一个基于HTTP 的管理界面。Solr已经在众多大型的网站中使用,较为成熟和稳定。Solr 包装并扩展了Luc 阅读全文
posted @ 2019-10-12 21:22 宏宇 阅读(967) 评论(0) 推荐(0) 编辑
solr的创建分片的方式
摘要:在Solr4.4之后,Solr提供了SolrCloud分布式集群的模式,它带来的主要好处是: (1)大数据量下更高的性能 (2)更好扩展性 (3)更高的可靠性 (4)更简单易用 什么时候应该使用SolrCloud(Shard)呢? (1)更大的数据量 (2)更大的索引体积 (3)想并行索引和查询 ( 阅读全文
posted @ 2019-09-03 14:03 宏宇 阅读(536) 评论(0) 推荐(0) 编辑
Solr查询空值字段
摘要:摘要: Solr的查询一般都是查找满足某个关键词的文档,偶然一个需求是查询Solr中某个字段不为空的数据。查询空值数据字符串类型可以通过下面这种查询方式找到所有描述description为空的数据。-description:* OR description:""整数类型可以通过下面这种查询方式找到所 阅读全文
posted @ 2019-05-24 16:44 宏宇 阅读(783) 评论(0) 推荐(0) 编辑
Solr中的group与facet的区别
摘要:Solr中的group与facet的区别 如果是简单的使用的话,那么Facet与group都可以用来进行数据的聚合查询,但是他们还是有很大的区别的。 首先上facet跟group的操作: Facet的例子: public voidFacetFieldQuery() throws Exception 阅读全文
posted @ 2019-04-25 01:11 宏宇 阅读(176) 评论(0) 推荐(0) 编辑
solr中facet及facet.pivot理解(整合两篇文章保留参考)
摘要:Facet['fæsɪt]很难翻译,只能靠例子来理解了。Solr作者Yonik Seeley也给出更为直接的名字:导航(Guided Navigation)、参数化查询(Paramatic Search)。 上面是比较直接的Faceted Search例子,品牌、产品特征、卖家,均是 Facet 。 阅读全文
posted @ 2019-04-25 01:10 宏宇 阅读(278) 评论(0) 推荐(0) 编辑
solr参数之facet
摘要:facet就像sql语句中的group一样,是对某一个字段进行group并count,即能够按照Facet的字段进行分组并统计。 一、基本使用: 必须属性:facet=true&facet.field=YOU_FIELD_NAME(注:facet=true打开层面,facet.field=YOU_F 阅读全文
posted @ 2019-04-25 01:09 宏宇 阅读(601) 评论(0) 推荐(0) 编辑
影响solr性能的一些因素(附使用经验)
摘要:Solr本身的性能不错,但是在使用过程中,还是会遇到一些使用错误,或是没考虑到的地方;在出现瓶颈时,可以首先考虑哪些点呢?下面就来看一下Solr官方的总结,个人觉得总结的很好。SOLR+LUCENE的官网还是挺给力的 对Schema设计的考虑 索引域的数量增长会很大程度的影响以下的内容: 引用 索引 阅读全文
posted @ 2019-04-23 18:12 宏宇 阅读(2280) 评论(0) 推荐(0) 编辑
solr中Cache综述
摘要:一、概述 Solr查询的核心类就是SolrIndexSearcher,每个core通常在同一时刻只由当前的SolrIndexSearcher供上层的handler使用(当切换SolrIndexSearcher时可能会有两个同时提供服务),而Solr的各种Cache是依附于SolrIndexSearc 阅读全文
posted @ 2019-04-21 23:46 宏宇 阅读(461) 评论(0) 推荐(0) 编辑
solr字段压缩属性compressed新版本已经移除
摘要:solr字段压缩属性compressed新版本已经移除 可能是考虑到压缩意义不大还减少搜索效率,所以去掉了。而且好像没有替代属性。 阅读全文
posted @ 2019-04-06 17:18 宏宇 阅读(249) 评论(0) 推荐(0) 编辑
solr schema.xml Field属性详解
摘要:常用的公共属性有:name:标识。 type:fieldType定义的类型。 indexed=true|false:是否被用来建立索引(关系到搜索和排序) stored=true|false:是否储存 compressed=true|false,是否使用gzip压缩(只有TextField和StrF 阅读全文
posted @ 2019-04-06 17:16 宏宇 阅读(538) 评论(0) 推荐(0) 编辑
通过Http接口及SolrNet 两种方法基于Solr5.5.1 实现CURD
摘要:通过Http接口及SolrNet 两种方法基于Solr5.5.1 实现CURD 前言 老规矩,任何技术的入门我通常都会总结增删改查,本文我就通过HttpWebRequest和SolrNet的方式实现Solr最基础的增删改查(CURD)。对于自己的完整项目,同时不想过于依赖第三方类库的则通过Http接 阅读全文
posted @ 2019-03-28 17:45 宏宇 阅读(218) 评论(0) 推荐(0) 编辑
solr如何让全词匹配结果在最前面
摘要:在全文搜索中默认排序是按照匹配度权值score排序的,权值越大位置越靠前,那为什么有很多时候全词匹配反而不在最前面那,其实很简单因为全词匹配权值也就是100,但是还有很多权值大于100的排在了前面。 比如 搜索“中国”,分词是 中,国,中国。那么有两个值“中国人”,“中国人在中国”这两个那个权值更大 阅读全文
posted @ 2019-03-27 15:59 宏宇 阅读(1170) 评论(0) 推荐(0) 编辑
ElasticSearch原理
摘要:Elasticsearch-基础介绍及索引原理分析 最近在参与一个基于Elasticsearch作为底层数据框架提供大数据量(亿级)的实时统计查询的方案设计工作,花了些时间学习Elasticsearch的基础理论知识,整理了一下,希望能对Elasticsearch感兴趣/想了解的同学有所帮助。 同时 阅读全文
posted @ 2019-02-21 16:59 宏宇 阅读(298) 评论(0) 推荐(0) 编辑
Solr字段类型field type的定义
摘要:摘要: Solr的字段类型定义了Solr如何解析字段数据并将数据检索出来,了解Solr的字段类型定义有助于更好的配置与使用Solr。 字段类型的定义 字段类型的定义主要包含如下四个方面的信息: 名称 实现的类名 如果field type 是TextField,则可以指定字段解析器 字段类型属性 在s 阅读全文
posted @ 2019-02-13 23:13 宏宇 阅读(1199) 评论(0) 推荐(0) 编辑
Solr Date类型的哪些你不得不了解的细节
摘要:我们先来看看Solr日期类型的一些内幕,然后讨论一下Solr日期类型存在的一些问题,最后我们看看怎么解决现存的问题。概述 DateField 在Solr4.x之前,我们只有DateField,这类型现在用的应该比较少了,它对应Java中的java.util.Date类型。实现上,如你所知它就是一个l 阅读全文
posted @ 2018-11-09 17:44 宏宇 阅读(1023) 评论(0) 推荐(0) 编辑
solr 使用edismax来控制评分
摘要:如何控制评分 如果设置了sort字段,那么将会按照sort字段的顺序返回结果。 如果没有设置sort字段,那么将会根据相关度打分来排序。也就是说,相关度更高的排在前面。 如何来定制适合自身业务的排序打分规则(boost)呢?经过这段时间的思考与实践,想到了如下三个方法:1、定制Lucene的boos 阅读全文
posted @ 2018-11-01 09:51 宏宇 阅读(653) 评论(0) 推荐(0) 编辑
solr 打分和排序机制(转载)
摘要:以下来自solr in action。 包含: 词项频次。查询词项出现在当前查询文档中的次数。 反向文档频次。查询词项出现在所有文档总的次数。 此项权重。 标准化因子: 字段规范: 文档权重。 字段权重。 长度归一化。消除长文档的优势。因为长文档的词项频次一般会比较大。 协调因子。避免一个文档中出现 阅读全文
posted @ 2018-11-01 09:50 宏宇 阅读(2048) 评论(1) 推荐(0) 编辑

上一页 1 2 3 4 5 6 ··· 8 下一页
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示