分布式搜索引擎Elasticsearch基础入门学习

一、Elasticsearch介绍

Elasticsearch介绍

Elasticsearh 是 elastic.co 公司开发的分布式搜索引擎。

Elasticsearch（简称ES）是一个开源的分布式、高度可扩展的全文搜索和分析引擎。它能够快速、近乎实时的存储、搜索和分析大量数据。适用于包括文本、数字、地理空间、结构化和非结构化数据等在内的所有类型数据。

它通常为具有复杂搜索功能的应用提供底层搜索技术。

当然，它也可以用来实现分布式数据存储、日志统计、分析、系统监控、地理空间查询等功能。

Elasticsearch 最底层的搜索引擎技术是 Apache 基金会开源的搜索引擎类库 Lucene，Lucene 提供了搜索引擎核心 API 。

Lucene 地址：https://lucene.apache.org/

ES 在 Lucene 的基础上提供了分布式支持，可以水平扩展，提供了 Restful 这种简洁的访问接口，能被任何语言调用。

Elasticsearch 官网：https://www.elastic.co/
github：https://github.com/elastic/elasticsearch

Elasticsearch能做什么

应用搜索，常见的 github 的代码搜索，滴滴，美团，点评，银行等各种搜索
网站搜索
日志记录和日志分析
基础设置指标和容器监控
应用性能监控
地理空间数据分析和可视化
商业分析
安全分析

二、ELK 是什么

ELK 是 Elasticsearch、Logstash 和 Kibana 的第一个字母组合，也叫 ELK Stack。是一套用于数据采集、存储、分析和可视化的开源工具集。

Elasticsearch：存储、索引、计算、搜索、分析数据。
Logstash：用于收集、转换数据，然后将它存储在 ES 中。后面还开发新的收集数据软件 Beats。
Beats：它是一个轻量级的数据采集代理工具，可以向 Elasticsearch 发送数据。
Kibana：用于查询分析、可视化 ES 的数据，它还可以用于监控和报警的方案。它是 Elasticsearch 基于浏览器的分析和搜索仪表盘。

它们之间关系图：

（来自：Elasticsearch 简介）

把上面的图简化下：

三、ES中的基础概念

文档document

Elasticsearch 是面向文档，它可以存储整个对象或文档。它不仅仅是存储，还会索引每个文档的内容使之可以被搜索。在 ES 中，你可以对文档进行索引、搜索、排序、过滤。

在 ES 中，文档是索引信息的基本单位。

JSON

Elasticsearch 使用 json 格式作为文档序列化格式。这种格式在 NoSQL 数据库中使用比较多。

一个 json 对象是由 key 和 value 组成。key 是字段（field）或属性（property）的名字，值（value）可以是字符串、数字、布尔类型、另外一个对象、值数组或其他特殊类型，比如表示日期的字符串或表示地理位置的对象。

在关系型数据库中，使用行和列存储数据，比如存储在 MySQL 表中的数据：

id	name
1	比亚迪电动车
2	理想电动车
3	小鹏电动车
4	比亚迪电池
5	理想电池

把上面的数据用 json 格式存储在 elasticsearch 中：

{
    "id": 1,
    "name": "比亚迪电动车"
}
{
    "id": 2,
    "name": "理想电动车"
}
{
    "id": 3,
    "name": "小鹏电动车"
}
{
    "id": 4,
    "name": "比亚迪电池"
}
{
    "id": 5,
    "name": "理想电池"
}

上面 json 中的字段 id 相当于 MySQL 数据表中列 id。

每个文档就是一条json数据。一条 json 数据相当于 MySQL 表中的一行。

索引index

index 索引是具有相似特征文档的集合。一个索引通过名字（必须全部是小写）来标识，并且在对其中的文档执行索引、搜索、更新和删除操作时，都会用到这个索引的名字。

索引可以是一个名词，相当于文档存储的地方。

索引也可以是一个动词，索引一个文档表示把一个文档存储到索引里，以便它可以被检索和查询。

例如，你有一个用户数据的索引，索引名称叫 user，每一份用户信息就是一个文档：

{
    "id": 1,
    "name": "tom",
    "age": 25
},
{
    "id": 2,
    "name": "hanlei",
    "age": 35
},
{
    "id": 1,
    "name": "tom",
    "age": 25
},
{
    "id": 3,
    "name": "hanmeimei",
    "age": 36
}

*类型type

类型 type 这个概念在 elasticsearch 7.X 已被完全移除（参考文档 Removal of mapping types)。这里就不作介绍。

映射mapping

映射（mapping）是索引文档中字段的类型和字段的其它信息，都存储在映射（mapping）中，它也叫模式定义（schema definition）。

相当于 MySQL 数据表的 schema，如定义表结构、字段名称、字段类型等信息。

而在 ES 中，映射可以设置某个字段的数据类型、默认值、分析器、是否被索引等等，其它处理 ES 里面的数据使用规则设置也叫映射。

mapping还有许多内容请查看文档：https://www.elastic.co/guide/en/elasticsearch/reference/8.4/mapping.html

mapping field doc：https://www.elastic.co/guide/en/elasticsearch/reference/8.4/mapping-fields.html

映射的设置：

{
    "mappings": {
      "properties": {
        "id": {
          "type": "keyword"
        },
        "message": {
          "type": "text"
        }
      }
    }
}

文档元数据

一个文档不仅仅包含 json 数据，也包含元数据 - 元数据是有关文档信息的一些数据。

创建映射时，可以自定义其中一些元数据字段的行为。例如，创建一个文档：

// 先创建一个映射mapping关系，相当于MySQL中表的schema，定义json文档中字段的属性
PUT test
{
    "mappings": {
      "properties": {
        "id": {
          "type": "keyword"
        },
        "message": {
          "type": "text"
        }
      }
    }
}

给文档写入一条数据：

// 给test索引写入一条json文档数据
PUT test/_doc/1
{
 "id": "12",
 "message": "hello world"
}

上面 PUT test/_doc/1 命令会返回一条信息：

{
   "_index" : "test",
   "_id" : "1",
   "_version" : 1,
   "result" : "created",
  "_shards" : {
     "total" : 2,
     "successful" : 1,
     "failed" : 0
   },
   "_seq_no" : 0,
   "_primary_term" : 1
}

_index：表示文档所属的索引
_id：文档唯一标识 ID
_source：表示文档 doc 的原生 json 数据
_size：整个 _source 字段的字节大小，它是由 mapper-size 插件提供
_shards：表示索引的分片数。一个索引可以划分为多个 shards，这样就可以存储更多的数据

分布式集群

节点node

一个节点node表示集群中的一台服务器，它作为集群的一部分存储数据，并参与集群的索引和搜索功能。

节点由名称标识，默认情况下是在启动时分配给节点的一个随机 UUID 唯一标识符。如果不想要默认值，可以自定义节点名称。

可以将节点通过集群名称加入特定集群中。默认情况下，每个节点都加入一个名为 “elasticsearch” 的集群中，这意味着如果

网络上启动了多个节点，它们可以相互发现，那么它们将自动形成一个名为 elasticsearch 的集群。

在单个集群中，你可以拥有任意数量的节点。

此外，如果网络上没有其它节点在运行，则会启动单个节点将默认形成一个名为 elasticsearch 的新节点集群。

集群cluster

集群(cluster)是由一个或多个节点node(服务器)组成，它们一起保存全部数据并提供跨所有节点的联合索引和搜索功能。集群由唯一标识符标识，默认为“elasticsearch”。这个名称很重要，因为一个节点被设置为通过名称加入集群时，该节点才能成为集群的一部分。

注意：拥有一个节点的集群也是完全可以的。

此外，你也可以拥有多个独立的集群，每个集群都拥有自己独立的名称。

分片shard和副本replica

索引可能会存储大量的数据，而这些数据的容量可能会超过单个节点服务器的硬件容量限制。比如，占用 1TB 磁盘空间的 10 亿文档的单个索引可能无法存储在单个节点的磁盘上，因为节点磁盘容量不足以容纳下这么大容量的数据，或者速度太慢无法满足来自单个节点的搜索速度请求。

这些问题怎么解决？

Elasticsearch 可以将索引的数据进行分割，这些分割的部分称为分片，每个分片可以分配到不同节点上。

相当于关系型数据中存储数据太多，而进行分库分表操作，把数据进行分散存储。

在 Elasticsearch 中，当你创建索引时，你可以定义想要的分片数量。每个分片都是一个功能齐全、独立的“索引”，可以在集群的任意节点上托管。

分片的好处：

它可以对数据进行水平拆分，扩展存储数据的容量

提供性能、吞吐量，它允许跨分片（可以在多个节点上）分布数据和并行化操作

如果发生网络故障，数据丢了怎么办？

这时就会用到数据副本replica功能。Elasticsearch 允许将索引分片构造复制成一个或多个副本，即所谓的复制分片，简称副本。

这样就提供了 ES 的高可用性，为了高可用，ES 不允许副本分片和主分片（或原始分片）分配在同一节点上。

集群架构图解

在 ES 中，索引 index 是由多个 json 格式的文档 document 组成的。每个索引 index 又可以划分为多个分片 Shard。

为了保证高可用，一个分片 shard，又可以分为主分片（primary shard）和副分片（replica shard），副分片是对主分片数据的备份，每个主分片可以有多个副分片，也就是说主分片可以有多个备份数据，

（每个索引index由多个documen组成）

（每个索引index可以划分为多个分片shard，上图划分为shard 1，shard 2，shard 3）

集群 cluster 和节点 Node，主分片 Primary 和副分片 Replica 的关系图：

(上图中虚线框里同颜色表示同一份数据的不同分片，Primary-主分片，和此主分片的副本（Replica - 副分片）)

对上面集群图 Cluster 说明：

把一个索引分成 3 个分片(主分片)：Primary 1，Primary 2，Primary 3，然后把 3 个主分片分配到 3 个不同节点Node上
每个主分片有 2 个副分片：Replica 1 和 Replica 2，且分别在不同的节点上。比如主分片 Primary 1 在 Node 1 上，它的副分片Replica 1 和 Replica 2 分别在 Node 2 和 Node 3 上

（上图：主分片和它所属副分片，副分片是对主分片数据的备份）

ES与关系型数据库对比

Elasticsearch 与关系型数据库的一个简单类比：

Elasticsearch（ES搜索引擎）	Relational DB（关系型数据库）
Indices（多个索引）	Databases（数据库）
Index（单个索引）	Table（表）
Document（文档）	Row（行）
Field（字段）	Column（列）

Elasticsearch集群可以包含多个索引(indices)（数据库），每一个索引包含多个文档(documents)（行），然后每个文档包含多个字段(Fields)（列）。用于理解 ES 中的概念，作一个简单的类比。

四、数据结构: 倒排索引

下面介绍 Elasticsearch 中最重要的数据结构之一 - 倒排索引。

索引简介

索引，在生活中最常见的就是书籍的目录，它就是一种类似索引结构，有时我们也叫索引目录，它能让人快速找到书籍相关章节的内容。

在计算机技术中，索引是一种常用的数据结构，目的就是加快查找数据的速度。比如我们常用的 MySQL 数据库，就有多种索引。

在搜索引擎中，面对海量的数据，如何根据关键字词快速找到用户需要的相关内容？

这里就要用到 倒排索引 这种数据结构，这是搜索引擎中最重要的数据结构。

倒排索引

倒排索引中的一些概念：

文档（document）：用来搜索的数据，一般是以文本形式存在的存储对象。比如一条短信，一封邮件等。更广义的还有 Word、PDF、XML 等不同格式的文档。
文档集合（document collection）：由若干个文档组成的集合叫文档集合。
文档编号（document id）：文档集合中每个文档的唯一编号，用这个唯一编号来标识这个文档。
词条（term）：对文档数据，用某种分词算法后，得到的有含义的词语就是词条。例如：我们好好学习，可以用分词算法分为：我们，好好学习，学习等几个词条。
倒排索引（inverted index）：倒排索引是实现词条和文档的一种存储形式。通过倒排索引，可以根据词条快速获取包含这个词语的文档列表。

我们平常使用 MySQL 关系型数据库存储数据，里面有数据表。创建一个关于电动车的数据表：

id	name
1	比亚迪电动车
2	理想电动车
3	小鹏电动车
4	比亚迪电池
5	理想电池

怎么把上面的表用倒排索引来表示呢？

词条（term）	文档id（doc id）
比亚迪	1,4
电动车	1,2,3
理想	2,5
小鹏	3
电池	4,5
车	1,2,3

这张表就是倒排索引。

上面 MySQL 中的表，可以看作是正向索引表，然后把这张表数据倒过来，就变成倒排索引表。

MySQL 表变成倒排索引表的处理过程：

利用分词算法对文档数据进行分词，得到一个一个词条。
创建倒排索引表，每行数据词条、文档id等

倒排索引表的词条具有唯一性，然后可以给词条创建索引加快查询速度，比如哈希表索引。

五、安装ES

下载并安装ES

因为我的是windows，所以我下载win的安装包，如果你是其它系统请下载相应平台的。我这里想下载 V8.4.3 版本，下载地址：

https://www.elastic.co/cn/downloads/past-releases/elasticsearch-8-4-3

但是我电脑上安装的是 JDK 1.8，不适合 8 以上的 ES 版本，见这里说明，JDK 和 ES 的对应版本。

后面我换到了能使用jdk 1.8 的 ES V7.17.10 版本。

https://www.elastic.co/cn/downloads/past-releases/elasticsearch-7-17-10

下载之后直接解压，然后进入 bin 目录，点击 elasticsearch.bat 启动 ES，启动会有一些时间，稍微等一下；

9300 是 tcp 通信端口，ES 集群之间使用 tcp 通信；9200 是 http 协议端口。

在浏览器上输入 http://localhost:9200/ 查看，我这里输出以下数据，安装成功了，

{
  "name": "AIS",
  "cluster_name": "elasticsearch",
  "cluster_uuid": "bKg5AkWZScafo0vp03XOyA",
  "version": {
    "number": "7.17.10",
    "build_flavor": "default",
    "build_type": "zip",
    "build_hash": "fecd68e3150eda0c307ab9a9d7557f5d5fd71349",
    "build_date": "2023-04-23T05:33:18.138275597Z",
    "build_snapshot": false,
    "lucene_version": "8.11.1",
    "minimum_wire_compatibility_version": "6.8.0",
    "minimum_index_compatibility_version": "6.0.0-beta1"
  },
  "tagline": "You Know, for Search"
}

安装elasticsearch-head插件

elasticsearch-head 插件可以查看 ES 的各种数据。

通过 git clone 下载 head 插件：

git clone https://github.com/mobz/elasticsearch-head.git
cd ./elasticsearch-head
npm install
npm run start

浏览器上打开：http://localhost:9100/

当然还有其它多种安装方式。

第二种方式 chrome 插件安装：

还可以通过 chrome extension 运行插件，Elasticsearch Head 在 Chrome store 的下载地址。

下载 chrome 插件后，安装到 chrome 浏览器里。

第三种方式 docker 安装：

通过 docker 安装，具体查看：https://github.com/mobz/elasticsearch-head

设置跨域:

如果连接不上 ES，需要设置跨域访问，打开配置文件 config/elasticsearch.yml，在最后增加下面配置项：

http.cors.enabled: true
http.cors.allow-origin: "*"

设置完成后，重新启动 ES。

打开 http://localhost:9100/，然后点击连接按钮，出现下面 green 颜色表示连接成功，如下图：

六、ES操作-增删改查搜

使用cURL命令操作ES

curl 操作命令格式

使用 curl，将请求从命令行提交到本地 Elasticsearch 实例，这些请求包含任何 HTTP 请求相同部分：

curl -X<VERB> '<PROTOCOL>://<HOST>:<PORT>/<PATH>?<QUERY_STRING>' -d '<BODY>'

命令参数说明：

命令参数	说明
<VERB>	HTTP 方法，例如，GET，POST，PUT，HEAD 或 DELETE
<PROTOCOL>	http 或 https，如果你在 ES 前面有一个 https 代理
<HOST>	Elasticsearch 集群中任何节点的主机名。或用 localhost 来代表本地机器上的节点
<PORT>	运行 Elasticsearch HTTP 服务的端口号，默认为 9200
<PATH>	API 的终端路径，可以包含多个参数，例如，_cluster/stats
<QUERY_STRING>	任何可选的查询字符串参数。
<BODY>	JSON 编码格式的请求正文，如果有需要

如果 elasticsearch 启动了安全功能，则必须提供有权限运行 API 的有效用户名和密码：

curl -u elastic:password -X<VERB> '<PROTOCOL>://<HOST>:<PORT>/<PATH>?<QUERY_STRING>' -d '<BODY>'

// elastic 用户名
// password 密码

curl 安装和文档地址

curl 下载地址 https://curl.se/download.html

安装：https://everything.curl.dev/build

https://everything.curl.dev/http http 语法

我是win这里用 chocolatey 安装：

choro install curl

安装完成后直接 cd 到它的安装目录 C:\ProgramData\chocolatey\bin 目录下，然后执行查看 curl 版本命令，安装成功：

不知道安装到哪里了？可以使用 where curl 命令来查询安装位置

查询 ES 的 http 服务端口 9200，命令：curl.exe -XGET 'http://localhost:9200' -H 'Content-Type: application/json'

这里还可以使用 Go 语言实现的 curl 工具 curlie 来操作 ES。

安装 curlie

go install github.com/rs/curlie@v1.6.0

用 curlie 在 terminal 上访问 HTTP 端口 9200，我是 win 使用 PowerShell，命令如下：

curlie -XGET 'http://localhost:9200' -H 'Content-Type: application/json'

返回结果：

如果 ES 设置了用户和密码，可以用如下命令：

$ curlie -XGET -u "elastic:pwdes" 'http://localhost:9200/' -H 'Content-Type: application/json'

说明：如果运行 curlie 返回安全错误信息，那么找到ES安装位置，然后在 config/elasticsearch.yml 文件最后面加上

xpack.security.enabled: false ，把安全验证设置为 false。

创建索引和文档

前面说了，索引 index 可以是名词存储文档的地方，也可以是动词创建索引的意思。

创建索引基本语法：

PUT /{索引名称}

创建索引和文档基本语法：

PUT /{索引名称}/_doc/文档id

// 也可以把上面 PUT 换成 POST

查询索引信息：

GET /{索引名称}

curl创建索引和文档：

例如，创建一个卖书的书店bookmall索引，然后给索引增加一些数据，命令如下：

curl -XPUT "http://localhost:9200/bookmall/_doc/1?pretty" -H "Content-Type: application/json" -d '{"product_id": 123456, "quantity": 100}'

我的是windows，在cmd下运行后出错，出错信息如下：

{
  "error" : {
    "root_cause" : [
      {
        "type" : "mapper_parsing_exception",
        "reason" : "failed to parse"
      }
    ],
    "type" : "mapper_parsing_exception",
    "reason" : "failed to parse",
    "caused_by" : {
      "type" : "json_parse_exception",
      "reason" : "Unexpected character ('p' (code 112)): was expecting double-quote to start field name\n at [Source: (ByteArrayInputStream); line: 1, column: 3]"
    }
  },
  "status" : 400
}

需要把上面的命令修改下，双引号前加上斜线，

curl -XPUT 'http://localhost:9200/bookmall/_doc/1?pretty' -H 'Content-Type: application/json' -d '{\"product_id\": 123456, \"quantity\": 100}'

在运行，成功了，返回信息：

{
  "_index" : "bookmall",
  "_type" : "_doc",
  "_id" : "1",
  "_version" : 1,
  "result" : "created",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 0,
  "_primary_term" : 1
}

在 linux 下就不需要加这条斜线，所以学习建议在 linux 平台下。 - -!

上面的命令 curl -XPUT 也可以换成 curl -XPOST

Postman 创建索引

例如，博客巴士的博客文章，我们可以用 ES 来索引这些博客文章信息。

下面我使用 Postman 这款测试 API 的软件来增加索引，打开 Postman 软件（如没安装请先安装），首先新建一个请求的 tab，

然后在 Headers 里加上 Content-Type: application/json ，如下：

然后请求方法选择 PUT， url 栏里填上 http://localhost:9200/blogerbus/_doc/1?pretty ，然后点击 body，选择 raw 选项，格式选择 JSON , 填上 json 格式的数据，最后点击 Send 按钮发送数据，如下图：

Status：201 Created ，成功返回数据：

{
    "_index": "blogerbus",
    "_type": "_doc",
    "_id": "1",
    "_version": 1,
    "result": "created",
    "_shards": {
        "total": 2,
        "successful": 1,
        "failed": 0
    },
    "_seq_no": 0,
    "_primary_term": 1
}

对这条 URL http://localhost:9200/blogerbus/_doc/1?pretty 的说明：

http://localhost:9200：ES HTTP 本地服务端地址:端口号

blogerbus：索引名称

_doc：文档终端endpoint，ES 里的一个固定字段

1：文档 id

?pretty：将返回的json格式化数据，显示为更易于让人阅读的形式

查询索引index文档

基本语法：

// 根据单个id查询
GET /{索引名称}/_doc/文档id

//批量查询：查询该索引库下的全部文档 
GET /{索引名称}/_search

// 查询某个索引详细信息
GET /{索引名称}

// 查询所有索引部分信息
GET /_cat/indices

Postman 查询

用 Postman 来查询索引文档，在url栏输入 http://localhost:9200/blogerbus/_doc/1?pretty=true，点击 Send，返回：

返回内容：

{
    "_index": "blogerbus",
    "_type": "_doc",
    "_id": "1",
    "_version": 1,
    "_seq_no": 0,
    "_primary_term": 1,
    "found": true,
    "_source": {
        "user": "lilei",
        "create_at": "2021-09-15T08:12:43",
        "title": "hello world",
        "article": "hello world, this is good thing"
    }
}

curl查询索引信息

// 查询单个索引详细信息
curl -XGET 'http://localhost:9200/bookmall?pretty' -H 'Content-Type:application/json'

// 查询 ES 中的所有索引部分信息
curl -XGET 'http://localhost:9200/_cat/indices?pretty' -H 'Content-Type:application/json'

搜索

基本语法：

GET /{索引名称}/_search  // 后面可以跟一些查询字符串，也可以跟json的DSL

给索引 blogerbus 多增加几个文档，用于我们的搜索：

// 第2篇文档，http://localhost:9200/blogerbus/_doc/2?pretty
{
    "user": "lilei", 
    "create_at": "2021-09-18T09:12:04", 
    "title": "math lesson",
    "article": "hello math, this my first lesson"
}

// 第3篇文档，http://localhost:9200/blogerbus/_doc/3?pretty
{
    "user": "hanmeimei", 
    "create_at": "2021-10-10T03:24:34", 
    "title": "test lesson",
    "article": "hello lesson, this my test lesson"
}

Postman 搜索

搜索 user 为 lilei 的所有文章，在 Postman 的url栏输入：http://localhost:9200/blogerbus/_search?q=user:lilei&pretty=true，点击 Send 按钮，返回值：

上面是直接在 url 上用字符串查询，还可以用 json 格式来查询：

{
    "query" : {
        "match" : { "user": "lilei" }
    }
}

url 修改为 http://localhost:9200/blogerbus/_search?pretty=true，

返回的数据与上面相同。

curl 搜索

curl -XGET 'http://localhost:9200/blogerbus/_search?pretty=true' -H 'Content-Type: application/json' -d '{\"query\": {\"match\":{\"user\": \"lilei\"}}}'

返回的内容与 Postman 搜索返回内容相同

删除

删除文档基本语法：

DELETE /{索引名称}/_doc/文档id

例如，curl 删除一篇 id 为 2 的文档：

curl -XDELETE 'http://localhost:9200/bookmall/_doc/2'

{"_index":"bookmall","_type":"_doc","_id":"2","_version":3,"result":"deleted","_shards":{"total":2,"successful":1,"failed":0},"_seq_no":3,"_primary_term":1}

后面没有加?pretty=true，所以返回数据排版是不易读的json。

删除索引基本语法：

DELETE /{索引名称}

修改

修改有2种方式：全量修改和增量修改

全量修改：直接覆盖原来的文档。根据指定 id 删除，id 不存在时，修改变成新增。

基本语法：

PUT /{索引名称}/_doc/文档id
{
    "字段1": "值1",
    "字段2": "值2",
    // ... 略
}

增量修改：修改文档中部分字段，只修改指定 id 中匹配文档的部分字段。

基本语法：

POST /{索引名称}/_update/文档id
{
    "doc": {
         "字段名": "新值",
    }
}

curl 全量修改：

把上面的 bookmall/_doc/1 中 2 个字段值都修改下：

curl -XPUT "http://localhost:9200/bookmall/_doc/1?pretty" -H "Content-Type: application/json" -d '{\"product_id\": 1234567, \"quantity\": 1000}'

修改成功后返回数据：

{
  "_index" : "bookmall",
  "_type" : "_doc",
  "_id" : "1",
  "_version" : 2,
  "result" : "updated",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 4,
  "_primary_term" : 1
}

那能不能修改值的同时新增一个字段？可以的。例如，给文档 id 为 1 的新增一个字段 num:50 ，修改 quantity 为 2000，如下：

curl -XPUT "http://localhost:9200/bookmall/_doc/1?pretty" -H "Content-Type: application/json" -d '{\"product_id\": 123456, \"quantity\": 2000,\"name\":\"shiije\",\"num\":50}'

可以修改成功。

curl 部分修改：

修改文档 id 为 1 中的字段 product_id 为 123，

curl -XPOST "http://localhost:9200/bookmall/_update/1?pretty" -H "Content-Type: application/json" -d '{\"doc\":{\"product_id\": 123}}'

可以修改成功。

七、参考

https://lucene.apache.org/ lucene
https://www.elastic.co/guide/en/elasticsearch/reference/8.4/elasticsearch-intro.html ES 文档
https://github.com/elastic/elasticsearch/tree/8.4/docs/reference
https://www.elastic.co/guide/en/elasticsearch/plugins/8.4/mapper-size.html
https://www.elastic.co/guide/en/elasticsearch/reference/7.17/docs-index_.html
https://github.com/elastic elastic github
https://github.com/elastic/kibana
《elasticsearch权威指南》
https://elasticstack.blog.csdn.net/article/details/98871531 Elasticsearch 简介
https://www.elastic.co/cn/support/matrix#matrix_jvm
https://www.elastic.co/guide/en/elasticsearch/reference/8.4/modules-node.html
https://everything.curl.dev/http curl http 语法
https://www.postman.com/ postman

posted @ 2023-05-10 11:57 九卷技术阅读(5045) 评论(2) 收藏举报

刷新页面返回顶部

九卷技术录--关注技术产品、管理

行万里路，破九卷书

分布式搜索引擎Elasticsearch基础入门学习

一、Elasticsearch介绍

Elasticsearch介绍

Elasticsearch能做什么

二、ELK 是什么

三、ES中的基础概念

文档document

JSON

索引index

*类型type

映射mapping

文档元数据

分布式集群

节点node

集群cluster

分片shard和副本replica

集群架构图解

ES与关系型数据库对比

四、数据结构: 倒排索引

索引简介

倒排索引

五、安装ES

下载并安装ES

安装elasticsearch-head插件

六、ES操作-增删改查搜

使用cURL命令操作ES

创建索引和文档

查询索引index文档

搜索

删除

修改

七、参考

公告