狂自私

导航

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

统计

随笔 - 380
文章 - 1
评论 - 14
阅读 - 26万

公告

昵称：狂自私
园龄： 6年11个月
粉丝： 16
关注： 0

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:内网离线部署redis7.2
我是傻逼，很多依赖包可以用everything版本的系统iso包做yum源。
--狂自私
2. Re:容器时区不一致如何解决？
一搜全是你的博客 😄😄😄
--白学
3. Re:容器时区不一致如何解决？
感谢大哥帮我近期看的面试题答案都写了
--白学
4. Re:SQL Server服务无法启动
NB，药到病除，想毕您查询也用了不少时间，非常感谢花时间分享出来，您帮助到了我，谢谢！
--钻葛格
5. Re:内网离线部署redis7.2
yumdownloader 命令可以加上--resolve参数来下载包的依赖组件，避免再次去单独下载依赖。
--狂自私

ES写入索引原理

Elasticsearch（ES）写入索引的原理涉及多个步骤，主要包括数据接收、解析、索引、存储等过程。以下是详细的步骤和原理：

1. 数据接收

当客户端向 Elasticsearch 发送数据时，通常通过 RESTful API 进行交互。数据可以是 JSON 格式的文档。
请求可以使用 PUT 或 POST 方法，其中 PUT 通常用于指定特定 ID 的文档，而 POST 则用于自动生成 ID。

2. 解析与路由

一旦接收到请求，Elasticsearch 会解析请求中的数据。
根据索引和类型，Elasticsearch 确定将数据写入哪个索引。
数据会根据文档的 _id 字段进行路由，以决定将数据发送到哪个分片（shard）。默认情况下，Elasticsearch 将 _id 通过哈希算法映射到一个分片。

3. 文档映射

Elasticsearch 会检查文档的结构是否符合预定义的映射（mapping）。映射定义了字段的数据类型、分析器等。
如果没有找到匹配的映射，Elasticsearch 会尝试自动推断字段类型，这可能导致性能问题或意外的数据处理。

4. 索引过程

文档被写入到相应的分片中。分片是 Elasticsearch 中的基本单位，每个索引可以有多个分片。
写入文档时，会将其转换为倒排索引（inverted index）。倒排索引是为了快速搜索而设计的，它包含了词项及其在文档中的位置。

5. Segment 和 Refresh

每个分片由多个段（segment）组成。写入时，文档首先被写入一个内存中称为“事务日志”（translog）的地方，然后在适当的时候批量刷新到磁盘上的段。
刷新操作会创建一个新的段，使得新数据可被搜索。默认每秒刷新一次，但可以根据需要调整频率。

6. 复制与高可用性

Elasticsearch 支持主分片（primary shard）和副本分片（replica shard）。写入数据时，主分片会处理写入请求，并将数据同步到副本分片，以确保数据的高可用性和冗余。

7. 确认与响应

最后，当数据成功写入后，Elasticsearch 会返回一个确认响应给客户端，告知操作是否成功。

总结

Elasticsearch 的写入索引机制是高效且灵活的，支持实时搜索和高可用性。然而，在使用时也需注意数据映射、分片策略以及性能调优等方面，以确保系统的最佳表现。

posted on 2024-09-12 08:17 狂自私阅读(93) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· ES存储原理

· 阐述下ES架构

· Elasticsearch索引文档过程

· ES面试知识点汇总（逻辑设计和物理设计、倒排索引、ES写入文档、查询文档的过程、ES的性能优化）

· Elasticsearch总结参照

阅读排行：
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布：重大改进与新特性概览！
· AI与.NET技术实操系列（二）：开始使用ML.NET
· 单线程的Redis速度为什么快？

AI FOR CODE 大赛