【ES HTTP-索引/文档增删改查&映射操作 01】

一、数据存储:

  • 结构化数据,一般会用二维的表结构来存储,如:mysql等关系型数据库
  • 非结构化数据,即无法用关系型数据库存储的数据,如:日志、通讯记录、报表、视频、图片等,一般会把这种类型的数据存储在NoSQL中,如:MongoDB,redis,Hbase等,并且是以k-v形式保存的,可以通过key来查询
  • 半结构化数据,将数据的结构和内容混在一起,比如:xml,html,这样的数据一般也会保存在MongoDB这样的nosql种,但是一个缺点是查询内容不太容易
  • Elaticsearch,简称为 ES,ES 是一个开源的高扩展的分布式全文搜索引擎,是整个 Elastic Stack 技术栈的核心。它可以近乎实时的存储、检索数据;本身扩展性很好,可以扩展到上百台服务器,处理 PB 级别的数据

二、docker安装elasticsearch7.8和kibana7.8

1、先设置系统参数max_map_count,否则 Elasticsearch 无法启动

/etc/sysctl.conf 文件添加vm.max_map_count=262144

执行更新命令:sysctl -p

2、创建共通网络,elasticsearch和kibana或者集群可以互相访问

docker network create es-net

3、拉取ES和kinana镜像

docker pull elasticsearch:7.8.0
docker pull elastic/kibana:7.8.0

4、创建映射容器的文件目录

# 用于挂载es插件目录和数据 创建01目录仅代表节点
mkdir -p -m 777 /mydata/es/01/plugins
mkdir -p -m 777 /mydata/es/01/data
mkdir -p -m 777 /mydata/es/01/logs

如果想创建多借点就继续映射02、03用于创建多个ES容器节点

6、启动ES

docker run --name=es-01 \
  --restart=always \
  --privileged \
  --net es-net \
  -p 9200:9200 \
  -p 9300:9300 \
  -v /mydata/es/01/plugins:/usr/share/elasticsearch/plugins \
  -v /mydata/es/01/data:/usr/share/elasticsearch/data \
  -v /mydata/es/01/logs:/usr/share/elasticsearch/logs \
  -e node.name=es-01 \
  -e node.master=true \
  -e network.host=es-01 \
  -e discovery.seed_hosts=es-01 \
  -e cluster.initial_master_nodes=es-01 \
  -e cluster.name=es-cluster \
  -e "ES_JAVA_OPTS=-Xms256m -Xmx256m" \
  -d elasticsearch:7.8.0

如果想多个节点集群,那么一开始所有的ES容器创建就要进行设置,有几个设置几个

-e discovery.seed_hosts=es-01,es-02,es-03,es-04 \

设置主节点

-e cluster.initial_master_nodes=es-01 \

别的属性按照自身设置即可(基本不用改,修改下对应的容器名字即可)

7、浏览器输入http://docker所在服务器的ip:9200 出现以下信息即为成功:

问题:浏览器输入地址后无法打开

第一步:进入ES容器内:

docker exec -it a02ec37af784 /bin/bash

第二步:修改elasticsearch.yml文件

vi config/elasticsearch.yml

#添加下面两行文件,并修改host为本机IP地址
http.cors.enabled: true
http.cors.allow-origin: "*"
network.host: 172.16.137.131

其中:
http.cors.enabled: true:此步为允许elasticsearch跨域访问,默认是false。
http.cors.allow-origin: “*”:表示跨域访问允许的域名地址(*表示任意)。

第三步:重启docker

docker restart es-01

再次浏览器输入,显示成功

8、创建kibana容器

docker run --name kibana -p 5601:5601 --restart=always --network=es-net -e ELASTICSEARCH_HOSTS=http://es-01:9200 -d elastic/kibana:7.8.0

-e ELASTICSEARCH_HOSTS=http://es-01:9200 \ 设置es的访问路径

浏览器输入:http://docker所在服务器的ip:5601 出现以下信息即为成功

三、Elasticsearch基本操作
1、数据格式

Elasticsearch是面向文档型数据库,一条数据在这里就是一个文档(相当于关系型数据库的一行)。下面是ES存储文档数据和MySQL存储数据的概念进行一个类比

ES里的index可以被看做是一个库,Type相当于表(ES7.x版本Type的概念已经被删除了),Documents相当于表的行

ES为了能快速准确的查询,用到了一个特殊的概念用于查询和存储,这个概念叫倒排索引

|-- 以下对比正排索引和倒排索引来了解ES倒排索引查询的原理

正排(向)索引:

id          content

-------------------

1001  my name is tom

1002   my name is jack

用ID来查询结果会很快,因为ID可以被作为主键,如果用content中的name查询因为有很多,所以会遍历整个数据库所以会很慢

倒排索引

keyword  id

------------------

name   1001,1002

tom   1001

name关键字查询,会匹配上1001,1002两个ID的数据,tom关键字查询会匹配上1001的数据,所以也能看出来ES是以关键字作为检索条件的,这样的优势是快速查询劣势就是无法精准查询

2、HTTP操作

2.1、索引操作

1)创建索引

对比关系型数据库,创建索引就等同于创建数据库

Postman中,向ES服务器发PUT请求:http://172.16.137.131:9200/house

注意:创建索引库的分片数默认1片,7.0.0之前的Elasticsearch版本默认是5片

     重复添加索引,会返回错误信息,因为put类型是具有密等性的

2)查看单个索引

向ES服务器发GET请求:http://172.16.137.131:9200/house

3)查看所有索引

向ES服务器发GET请求:http://172.16.137.131:9200/_cat/indices?v

_cat查看的意思,indices表示索引,类似MySQL中的show tables

4)删除索引

向ES服务器发DELETE请求:http://172.16.137.131:9200/house

2.2、文档操作

1)创建文档 --类比插入表数据,添加的数据格式是JSON格式

发送POST请求:http://172.16.137.131:9200/shopping/_doc

 

上面的ID由于没有指定,所以默认情况下ES会随机生成一个,如果想要自定义唯一性标识符,可以在创建时指定http://172.16.137.131:9200/shopping/_doc/1001

2)查看文档 --查看文档时,需要指明文档的唯一性标识,类似于MySQL中数据的主键查询

发送GET请求:http://172.16.137.131:9200/shopping/_doc/10010

3)修改文档

发送POST请求:{{es_url}}/shopping/_doc/10010

 

4)修改字段 --只修改一条数据的局部信息

发送POST请求:{{es_url}}/shopping/_update/10010

请求体内容:
{ 
 "doc": {
 "price":3000.00
 } 
}

5)删除文档 --这里的删除是逻辑删除

发送DELETE请求:{{es_url}}/shopping/_doc/10011

6)条件删除文档

一般删除数据都是根据唯一标识进行删除,实际操作时,也可以根据条件对多条数据进行删除

# 删除shopping索引下price=3999的所有数据

发送POST请求:{{es_url}}/shopping/_delete_by_query

//请求体
{
    "query":{
        "match":{
            "price":3999.00
        }
    }
}

2.3、映射关系

创建了索引库就相当于创建了database,接下来就需要建映射了(映射类似于数据库中的表结构)创建数据库表需要设置字段名称,类型,长度,约束等,索引库也一样,需要知道这个类型下

有哪些字段,每个字段有哪些约束信息,这就叫做映射

 

1)创建映射

发送PUT请求:{{es_url}}/shopping/_mapping

//请求体内容
{
    "properties": {
        "name": {
            "type": "text",
            "index": true
        },
        "sex": {
            "type": "text",
            "index": false
        },
        "age": {
            "type": "long",
            "index": false
        }
    }
}

映射数据说明:

  • 字段名:任意填写,下面指定许多属性,例如:title、subtitle、images、price
  • type:类型,ES中支持的数据类型非常丰富,说几个关键的:
    • String类型,又分为两种:
      • text:可分词
      • keyword 不可分词,数据会作为完整字段进行匹配
    • Numerical:数值类型,分两类
      • 基本数据类型:long、integer、short、byte、double、float、half_float
      • 浮点数的高精度类型Lscaled_float
    • Date:日期类型
    • Array:数组类型
    • Object:对象
    • index:是否索引,默认为true,也就是说不进行任何配置,所有字段都会被索引
      • true:字段会被索引,则可以用来进行搜索
      • false:字段不会被索引,不能用来搜索
    • store:是否将数据进行独立存储,默认为false
      • 原始的文本会存储在_source里面,默认情况下提取出来的字段都不是独立存储的是从_source里面提取出来的,要想独立存储需要设置store:true,获取独立存储的字段要比_source中解析快的多,但是也会占用更多的空间,所以需要根据实际业务需求来设置
    • analyzer:分词器,这里的ik_max_word即使用ik分词器

2)查看映射

发送GET请求:{{es_url}}/shopping/_mapping

 

 

3)索引映射关联

发送PUT请求:{{es_url}}/shopping1

 

//请求体内容
{
    "settings": {},
    "mappings": {
        "properties": {
            "name": {
                "type": "text",
                "index": true

            },
            "sex": {
                "type": "text",
                "index": false
            },
            "age": {
                "type": "long",
                "index": false
            }
        }
    }
}

 

 

posted @ 2023-01-18 10:31  尘封~~  阅读(59)  评论(0编辑  收藏  举报