elk - 随笔分类(第2页) - fat_girl_spring

logstash的-dissect

摘要：描述 Dissect过滤器是一种拆分操作。与常规拆分操作(其中一个分隔符应用于整个字符串)不同，此操作将一组分隔符应用于字符串值。Dissect不使用正则表达式，速度非常快。 filter { dissect { mapping => { "message" => "%{ts} %{+ts} %{+ 阅读全文

posted @ 2021-01-25 16:19 fat_girl_spring 阅读(1031) 评论(0) 推荐(0) 编辑

logstash的gsub

摘要：gsub 使用规则 filter { mutate { gsub => [ # replace all forward slashes with underscore # 用下划线替换所有的斜杠 "fieldname", "/", "_", # replace backslashes, questi 阅读全文

posted @ 2021-01-25 15:55 fat_girl_spring 阅读(821) 评论(0) 推荐(0) 编辑

logstash的pipeline

摘要：一个 logstash 实例中可以同时进行多个独立数据流程的处理工作，如下图所示。而在这之前用户只能通过在单机运行多个 logstash 实例或者在配置文件中增加大量 if-else 条件判断语句来解决。要使用 multiple pipeline 也很简单，只需要将不同的 pipeline 在 c 阅读全文

posted @ 2021-01-22 14:11 fat_girl_spring 阅读(4133) 评论(1) 推荐(0) 编辑

Logstash：使用 aggregate filter 处理 N:N 关系

摘要：使用Logstash从mysql同步用户和用户所有的宠物到ES中。 "register_name": "孟林洁", "id": 80469531, "pets": [ { "breed_name": "万能梗", "birthday": null, "pet_id": 999044, "name": 阅读全文

posted @ 2021-01-20 17:57 fat_girl_spring 阅读(705) 评论(0) 推荐(0) 编辑

如何使用 Logstash 和 JDBC 确保 Elasticsearch 与关系型数据库保持同步

摘要：MySQL 设置 CREATE DATABASE es_db; USE es_db; DROP TABLE IF EXISTS es_table; CREATE TABLE es_table ( id BIGINT(20) UNSIGNED NOT NULL, PRIMARY KEY (id), U 阅读全文

posted @ 2021-01-20 16:22 fat_girl_spring 阅读(174) 评论(0) 推荐(0) 编辑

ElasticSearch集群shard均衡策略

摘要：shard分配策略集群分片分配是指将索引的shard分配到其他节点的过程，会在如下情况下触发：集群内有节点宕机，需要故障恢复；增加副本；索引的动态均衡，包括集群内部节点数量调整、删除索引副本、删除索引等情况；上述策略开关，可以动态调整，由参数cluster.routing.allocati 阅读全文

posted @ 2021-01-19 14:31 fat_girl_spring 阅读(2348) 评论(0) 推荐(0) 编辑

ElasticSearch6.3.2 集群做节点冷(warm) 热(hot) 分离

摘要：把现有的5台节点全做hot节点，另外新增2台节点做warm节点。参考官方bloghot-warm-architecture-in-elasticsearch-5-x架构实现。需要注意的地方主要是：不要让已有的索引分片被ES自动Rebalance到warm节点上去了，并且新创建的索引，只应该分配在ho 阅读全文

posted @ 2021-01-16 10:28 fat_girl_spring 阅读(490) 评论(0) 推荐(0) 编辑

ES索引生命周期管理二

摘要：如果你要处理时间序列数据，则不想将所有内容连续转储到单个索引中。取而代之的是，您可以定期将数据滚动到新索引，以防止数据过大而又缓慢又昂贵。随着索引的老化和查询频率的降低，您可能会将其转移到价格较低的硬件上，并减少分片和副本的数量。要在索引的生命周期内自动移动索引，可以创建策略来定义随着索引的老阅读全文

posted @ 2021-01-15 15:41 fat_girl_spring 阅读(552) 评论(0) 推荐(0) 编辑

ES索引生命周期管理一

摘要：ES从6.7版本推出了索引生命周期管理（Index Lifecycle Management ，简称ILM)机制，能帮我们自动管理一个索引策略（Policy）下索引集群的生命周期。索引策略将一个索引的生命周期定义为四个阶段： Hot：索引可写入，也可查询。 Warm：索引不可写入，但可查询。 Col 阅读全文

posted @ 2021-01-15 15:28 fat_girl_spring 阅读(1094) 评论(0) 推荐(0) 编辑

es数据的冷热分离实验

摘要：hot node：用于支持索引并写入新文档、 warm node：用于处理不太频繁查询的只读索引 Hot node 我们可以使用 hot node 来做 indexing： indexing 是 CPU 和 IO 的密集操作，因此热节点应该是功能强大的服务器比 warm node 更快的存储 Wa 阅读全文

posted @ 2021-01-15 11:54 fat_girl_spring 阅读(1174) 评论(0) 推荐(0) 编辑

ES Pipeline Aggregation(管道聚合)

摘要：主要有如下两种管道聚合方式： parent sibling 下面一一介绍ES定义的管道聚合。 Avg Bucket 聚合同级管道聚合，它计算同级聚合中指定度量的平均值。同级聚合必须是多桶聚合，针对的是度量聚合(metric Aggregation)。示例如下： { "avg_bucket": { 阅读全文

posted @ 2021-01-06 15:36 fat_girl_spring 阅读(1484) 评论(0) 推荐(0) 编辑

Elasticsearch索引自动套用模板

摘要：方案选择：方案一：可对logstash配置output参数：如下所示：这种方案在logstash中指定模板文件，由logstash将template写入ES集群；方案二：直接将template写入ES集群通过ES提供的API，将JSON格式的template写入目标ES集群的_templa 阅读全文

posted @ 2021-01-06 15:03 fat_girl_spring 阅读(216) 评论(0) 推荐(0) 编辑

干货 | BAT等一线大厂 Elasticsearch面试题解读

摘要：1、elasticsearch了解多少，说说你们公司es的集群架构，索引数据大小，分片有多少，以及一些调优手段。面试官：想了解应聘者之前公司接触的ES使用场景、规模，有没有做过比较大规模的索引设计、规划、调优。解答：如实结合自己的实践场景回答即可。比如：ES集群架构13个节点，索引根据通道阅读全文

posted @ 2020-11-24 20:06 fat_girl_spring 阅读(171) 评论(0) 推荐(0) 编辑

4个最难的 Elastic Search 面试题

摘要：面试题 es 写入数据的工作原理是什么啊？es 查询数据的工作原理是什么啊？底层的 lucene 介绍一下呗？倒排索引了解吗？面试官心理分析问这个，其实面试官就是要看看你了解不了解 es 的一些基本原理，因为用 es 无非就是写入数据，搜索数据。你要是不明白你发起一个写入和搜索请求的时候，es 阅读全文

posted @ 2020-11-24 17:31 fat_girl_spring 阅读(526) 评论(0) 推荐(0) 编辑

Elasticsearch调优实践

摘要：Elasticsearch（ES）作为NOSQL+搜索引擎的有机结合体，不仅有近实时的查询能力，还具有强大的聚合分析能力。因此在全文检索、日志分析、监控系统、数据分析等领域ES均有广泛应用。而完整的Elastic Stack体系（Elasticsearch、Logstash、Kibana、Beats 阅读全文

posted @ 2020-11-24 14:36 fat_girl_spring 阅读(299) 评论(0) 推荐(0) 编辑

Elasticsearch中JVM性能调优

摘要：ES JVM参数的配置：将 Xms 和 Xmx 设置成一样大避免JVM堆的动态调整给应用进程带来"不稳定"。参考：Heap Tuning Parameters By default, the JVM grows or shrinks the heap at each GC to try to k 阅读全文

posted @ 2020-11-24 12:06 fat_girl_spring 阅读(988) 评论(0) 推荐(0) 编辑

Elasticsearch索引和查询性能调优

摘要：Elasticsearch部署建议 1、选择合理的硬件配置：尽量使用SSD Elasticsearch 最大的瓶颈往往是磁盘读写性能，尤其是随机读取性能。使用SSD（PCI-E接口SSD卡/SATA接口SSD盘）通常比机械硬盘（SATA盘/SAS盘）查询速度快5~10倍，写入性能提升不明显。对于文阅读全文

posted @ 2020-11-23 20:31 fat_girl_spring 阅读(1705) 评论(0) 推荐(0) 编辑

elasticsearch数据冷热分离、数据冷备

摘要：环境： 6个es节点冷热配置 es1 master节点 # elasticsearch.yml node.name: "es1" cluster.name: "docker-cluster" network.host: 0.0.0.0 node.master: true node.data: fa 阅读全文

posted @ 2020-11-23 14:56 fat_girl_spring 阅读(1791) 评论(0) 推荐(0) 编辑

python操作es批量读取数据

摘要：Python连接elasticserach python连接elasticsearch有一下几种连接方式 pip3 instal elasticsearch from elasticsearch import Elasticsearch es = Elasticsearch() # 默认连接本地el 阅读全文

posted @ 2020-11-23 11:12 fat_girl_spring 阅读(1107) 评论(0) 推荐(0) 编辑

ES内存使用分析及熔断器设置

摘要：内存占用 ES的JVM heap按使用场景分为可GC部分和常驻部分。可GC部分内存会随着GC操作而被回收；常驻部分不会被GC，通常使用LRU策略来进行淘汰；内存占用情况如下图： common space包括了indexing buffer和其他ES运行需要的class。indexing buf 阅读全文

posted @ 2020-11-23 10:42 fat_girl_spring 阅读(1139) 评论(0) 推荐(0) 编辑

fat_girl_spring

随笔分类 - elk

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论