【G】ElasticSearch - 随笔分类 - |旧市拾荒|

ElasticSearch7.3学习(三十四)----生产环境集群部署总结

摘要：1、集群部署 2、结点的三个角色主结点：master节点主要用于集群的管理及索引比如新增结点、分片分配、索引的新增和删除等。数据结点：data 节点上保存了数据分片，它负责索引和搜索操作。客户端结点：client 节点仅作为请求客户端存在，client的作用也作为负载均衡器，client 节阅读全文

posted @ 2022-07-03 10:57 |旧市拾荒| 阅读(145) 评论(0) 推荐(0)

ElasticSearch7.3学习(三十三)----kibana之Grok Dubugger

摘要：在ElasticSearch7.3学习(三十二) logstash三大插件（input、filter、output）及其综合示例中学到logstash使用filter插件进行数据清洗，grok是一个十分强大的logstash filter插件，他可以通过正则解析任意文本，将非结构化日志数据弄成结构化阅读全文

posted @ 2022-07-03 10:55 |旧市拾荒| 阅读(298) 评论(0) 推荐(0)

ElasticSearch7.3学习(三十二)----logstash三大插件（input、filter、output）及其综合示例

摘要：1、 Logstash输入插件 1.1 input介绍 logstash支持很多数据源，比如说file，http，jdbc，s3等等图片上面只是一少部分。详情见网址：https://www.elastic.co/guide/en/logstash/current/input-plugins.htm 阅读全文

posted @ 2022-06-25 22:41 |旧市拾荒| 阅读(1591) 评论(0) 推荐(1)

ElasticSearch7.3学习(三十一)----Logstash基础学习

摘要：一、Logstash基本介绍 Logstash 是一个功能强大的工具，可与各种部署集成。它提供了大量插件，可帮助你解析，丰富，转换和缓冲来自各种来源的数据（文件、数据库......）。logstash简单来说就是一个数据抽取工具，将数据从一个地方转移到另一个地方。 Logstash 是 Elast 阅读全文

posted @ 2022-06-09 22:25 |旧市拾荒| 阅读(312) 评论(0) 推荐(0)

ElasticSearch7.3学习(三十)----ES7.X SQL新特性解析及使用Java api实现sql功能

摘要：一、ES7 sql新特性 1.1 数据准备创建索引及映射建立价格、颜色、品牌、售卖日期四个字段 PUT /tvs PUT /tvs/_mapping { "properties": { "price": { "type": "long" }, "color": { "type": "keywo 阅读全文

posted @ 2022-06-06 22:39 |旧市拾荒| 阅读(1306) 评论(0) 推荐(0)

ElasticSearch7.3学习(二十九)----聚合实战之使用Java api实现电视案例

摘要：一、数据准备创建索引及映射建立价格、颜色、品牌、售卖日期字段 PUT /tvs PUT /tvs/_mapping { "properties": { "price": { "type": "long" }, "color": { "type": "keyword" }, "brand": { 阅读全文

posted @ 2022-05-28 10:22 |旧市拾荒| 阅读(572) 评论(0) 推荐(0)

ElasticSearch7.3学习(二十八)----聚合实战之电视案例

摘要：一、电视案例 1.1 数据准备创建索引及映射建立价格、颜色、品牌、售卖日期字段 PUT /tvs PUT /tvs/_mapping { "properties": { "price": { "type": "long" }, "color": { "type": "keyword" }, " 阅读全文

posted @ 2022-05-25 20:03 |旧市拾荒| 阅读(641) 评论(2) 推荐(3)

ElasticSearch7.3学习(二十七)----聚合概念（bucket和metric）及其示例

摘要：一、两个核心概念：bucket和metric 1.1 bucket 有如下数据 city name 北京张三北京李四天津王五天津赵六天津王麻子划分出来两个bucket，一个是北京bucket，一个是天津bucket 北京bucket：包含了2个人，张三，李四上海bucket：包阅读全文

posted @ 2022-05-22 19:46 |旧市拾荒| 阅读(491) 评论(0) 推荐(1)

ElasticSearch7.3学习(二十六)----搜索（Search）参数总结、结果跳跃（bouncing results）问题解析

摘要：1、preference 首先引入一个bouncing results问题，两个document排序，field值相同；不同的shard上，可能排序不同；每次请求轮询打到不同的replica shard上；每次页面上看到的搜索结果的排序都不一样。这就是bouncing result，也就是跳跃的结果阅读全文

posted @ 2022-05-18 21:44 |旧市拾荒| 阅读(741) 评论(0) 推荐(1)

ElasticSearch7.3学习(二十五)----Doc value、query phase、fetch phase解析

摘要：1、Doc value 搜索的时候，要依靠倒排索引；排序的时候，需要依靠正排索引，看到每个document的每个field，然后进行排序。所谓的正排索引，其实就是doc values。在建立索引的时候，一方面会建立倒排索引，以供搜索用；一方面会建立正排索引，也就是doc values，以供排序阅读全文

posted @ 2022-05-15 17:11 |旧市拾荒| 阅读(320) 评论(0) 推荐(1)

ElasticSearch7.3学习(二十四)----相关度评分机制详解

摘要：1、算法介绍 relevance score(相关性分数) 算法，简单来说，就是计算出，一个索引中的文本，与搜索文本，他们之间的关联匹配程度。Elasticsearch使用的是 term frequency/inverse document frequency算法，简称为TF/IDF算法。TF词频( 阅读全文

posted @ 2022-05-12 22:55 |旧市拾荒| 阅读(309) 评论(0) 推荐(0)

ElasticSearch7.3学习(二十三)----RestHighLevelClient Java api实现match_all、ids、match、term、multi_match、bool、filter、sort等不同的搜索方式

摘要：1、数据准备首先创建book索引 PUT /book/ { "settings": { "number_of_shards": 1, "number_of_replicas": 0 }, "mappings": { "properties": { "name": { "type": "text", 阅读全文

posted @ 2022-05-10 23:04 |旧市拾荒| 阅读(187) 评论(0) 推荐(0)

ElasticSearch7.3学习(二十二)----Text字段排序、Scroll分批查询场景解析

摘要：1、Text字段排序场景：数据库中按照某个字段排序，sql只需写order by 字段名即可，如果es对一个text field进行排序，es中无法排序。因为文档入倒排索引表时，分词存入，es无法知道此字段的真实值。这样的结果往往不准确，因为分词后是多个单词，再排序就不是我们想要的结果了。通常有阅读全文

posted @ 2022-05-08 23:09 |旧市拾荒| 阅读(870) 评论(0) 推荐(0)

ElasticSearch7.3学习(二十一)----Filter与Query对比、使用explain关键字分析语法

摘要：1、数据准备首先创建book索引 PUT /book/ { "settings": { "number_of_shards": 1, "number_of_replicas": 0 }, "mappings": { "properties": { "name": { "type": "text", 阅读全文

posted @ 2022-04-19 23:21 |旧市拾荒| 阅读(514) 评论(0) 推荐(0)

ElasticSearch7.3学习(二十)----采用restful风格查询详解

摘要：1、Query DSL入门 1.1 DSL DSL:Domain Specified Language，特定领域的语言。es特有的搜索语言，可在请求体中携带搜索条件，功能强大。查询全部 GET /book/_search { "query": { "match_all": {} } } 排序 GE 阅读全文

posted @ 2022-04-18 21:45 |旧市拾荒| 阅读(263) 评论(0) 推荐(1)

ElasticSearch7.3学习(十九)---- deep paging

摘要：1、什么是deep paging 根据相关度评分倒排序，所以分页过深，协调节点会将大量数据聚合分析。 2、deep paging 性能问题 1消耗网络带宽，因为所搜过深的话，各 shard 要把数据传递给 coordinate node，这个过程是有大量数据传递的，消耗网络。 2消耗内存，各 sha 阅读全文

posted @ 2022-04-17 22:50 |旧市拾荒| 阅读(139) 评论(0) 推荐(0)

ElasticSearch7.3学习(十八)----多索引搜索

摘要：1、multi-index 多索引搜索多索引搜索就是一次性搜索多个index下的数据 /_search：所有索引下的所有数据都搜索出来 /index1/_search：指定一个index，搜索其下所有的数据 /index1,index2/_search：同时搜索两个index下的数据 /index 阅读全文

posted @ 2022-04-17 17:09 |旧市拾荒| 阅读(533) 评论(0) 推荐(0)

ElasticSearch7.3学习(十七)----搜索结果字段解析及time_out字段解析

摘要：1、搜索结果字段解析首先插入一条测试数据 PUT /my_index/_doc/1 { "title": "2019-09-10" } 然后无条件搜索所有 GET my_index/_search 得到的结果 { "took" : 0, "timed_out" : false, "_shards" 阅读全文

posted @ 2022-04-06 21:51 |旧市拾荒| 阅读(242) 评论(0) 推荐(0)

ElasticSearch7.3学习(十六)----RestHighLevelClient Java api实现索引的创建、删除、是否存在、关闭、开启

摘要：1、写在前面注意：导入的包区别，不同的包创建索引的方式不同。博主亲身实践，具体体现在createIndexRequest.mapping()里面。读者可自行试验。 import org.elasticsearch.client.indices.CreateIndexRequest; import 阅读全文

posted @ 2022-04-02 22:44 |旧市拾荒| 阅读(3868) 评论(0) 推荐(0)

ElasticSearch7.3学习(十五)----中文分词器(IK Analyzer)及自定义词库

摘要：1、中文分词器 1.1 默认分词器先来看看ElasticSearch中默认的standard 分词器，对英文比较友好，但是对于中文来说就是按照字符拆分，不是那么友好。 GET /_analyze { "analyzer": "standard", "text": "中华人民共和国" } 我们想要阅读全文

posted @ 2022-03-28 21:27 |旧市拾荒| 阅读(6341) 评论(0) 推荐(1)

|旧市拾荒|

三年工作经验，任职于某银行科技部门，从事后端开发与数据开发。

随笔分类 - 【G】ElasticSearch

公告