ES常用查询命令

一、基本命令

1、获取所有_cat命令

curl -X GET localhost:9200/_cat

示例图像

2、获取es集群服务健康状态

curl -X GET localhost:9200/_cat/health?v

示例图像
  • epoch: 时间戳的 Unix 时间戳格式,表示快照生成的时间。
  • timestamp: 可读性更强的时间戳格式,表示快照生成的时间(08:06:34)。
  • cluster: Elasticsearch 集群的名称,这里是 "es-cluster"。
  • status: 集群的健康状态,这里是 "yellow"。Elasticsearch 集群状态通常有三种:green(绿色,健康),yellow(黄色,部分健康),red(红色,不健康)。"yellow" 状态表示集群中的某些副本不可用,但主分片是可用的。
  • node.total: 集群中节点的总数,这里是 1 个节点。
  • node.data: 充当数据节点的节点数,这里是 1 个节点。
  • shards: 集群中分片的总数,这里是 98 个分片。
  • pri: 主分片(primary shard)的数量,这里是 98 个主分片。
  • relo: 正在进行重新定位的分片数量,这里是 0。
  • init: 初始化的分片数量,这里是 0。
  • unassign: 未分配的分片数量,这里是 27。
  • pending_tasks: 挂起的任务数,这里是 0。
  • max_task_wait_time: 最大任务等待时间,这里是没有具体数值。
  • active_shards_percent: 活动分片的百分比,这里是 78.4%。这表示在集群中,有 78.4% 的分片是活动的,而剩下的可能是不可用或者正在恢复的。

3、查看es节点信息

curl -X GET localhost:9200/_cat/nodes?v

示例图像
  • ip: 节点的IP地址,这里是"192.168.52.11"。
  • heap.percent: 节点的堆内存使用百分比,这里是67%。
  • ram.percent: 节点的系统内存使用百分比,这里是98%。
  • cpu: 节点的CPU使用率,这里是10%。
  • load_1m: 1分钟负载平均值,这里是0.69。
  • load_5m: 5分钟负载平均值,这里是0.36。
  • load_15m: 15分钟负载平均值,这里是0.50。
  • node.role: 节点的角色,这里是"*",表示这是一个主节点(master node)。
  • master: 指示该节点是否是主节点,这里是"*",表示它是主节点。
  • name: 节点的名称,这里是"node-1"。

4、查看es指定节点信息

curl -X GET localhost:9200/_nodes/node-1?pretty=true

示例图像

二、索引操作

1、查看ES中所有的索引

curl -X GET localhost:9200/_cat/indices?v

示例图像
  • health: 索引的健康状态,这里是 "yellow"。Elasticsearch 索引的健康状态有三种:green(绿色,健康),yellow(黄色,部分健康),red(红色,不健康)。"yellow" 状态表示索引的某些分片处于未分配状态,但主分片是可用的。
  • status: 索引的状态,这里是 "open"。这表示索引处于打开状态,可以进行读取和写入操作。
  • index: 索引的名称,这里是 "nginx-access-log-2023.09.13"。
  • uuid: 索引的唯一标识符。
  • pri: 主分片(primary shard)的数量,这里是 1 个主分片。
  • rep: 副本分片(replica shard)的数量,这里也是 1 个副本分片。
  • docs.count: 索引中文档的总数,这里是 20。
  • docs.deleted: 索引中已删除的文档数量,这里是 0。
  • store.size: 索引的存储大小,这里是 34.1KB。
  • pri.store.size: 主分片的存储大小,这里也是 34.1KB。

2、新建索引

curl -X PUT localhost:9200/testyf

示例图像

3、新建索引并增加数据 POST /索引/端点

POST /data/_bulk
{ "index": { "_id": 1 }}
{ "articleID" : "XHDK-A-1293-#fJ3", "userID" : 1, "hidden": false, "postDate": "2022-01-01" }
{ "index": { "_id": 2 }}
{ "articleID" : "KDKE-B-9947-#kL5", "userID" : 1, "hidden": false, "postDate": "2022-01-02" }

4、追加数据

# 追加新增字段
POST /data/_bulk
{"update":{"_id":"1"}}
{"doc":{"title":"this is java and elasticsearch blog"}}

5、删除索引

curl -X DELETE localhost:9200/testyf

示例图像

6、查看指定索引信息

curl -X GET localhost:9200/nginx-access-log-2023.09.13?pretty

示例图像

7、查看索引的统计信息

curl -X GET localhost:9200/nginx-access-log-2023.09.13/_stats?pretty

示例图像

三、文档操作

一)查询索引中的全部文档

curl -X GET localhost:9200/nginx-access-log-2023.09.13/_search?pretty
注意:?pertty 表示让数据格式化,更好的展示

示例图像

2)根据条件查询索引中的文档

单一条件搜索:

1、搜索 response_code 包含 200
POST /nginx-access-log-2023.09.13/_search?pretty
{
  "query": {
    "match": {
      "response_code": "200"
    }
  }
}
示例图像
2、搜索 message 包含 34 或者 包含 36
POST /nginx-access-log-2023.09.25/_search?pretty
{
  "query": {
    "match": {
      "message": "34 36"
    }
  },
  "size": 1000
}
3、搜索 message 包含 34 并且 包含 36
POST /nginx-access-log-2023.09.25/_search?pretty
{
  "query": { 
    "match": { 
      "message": {
        "query": "34 36",
        "operator": "and"
      }
    } 
  },
  "size": 1000
}
4、搜索 message 包含 34 36 15 22 中超过 50% 以上比例的
POST /nginx-access-log-2023.09.25/_search?pretty
{
  "query": { 
    "match": { 
      "message": {
        "query": "34 36 15 22",
        "minimum_should_match": "50%"
      }
    } 
  },
  "size": 1000
}
5、使用sort对查询数据排序,并按照size返回查询的数量(desc:降序 / asc:升序)
GET /data/_search?size=2
{
  "query": {
    "match": {
      "title": "java elasticsearch"
    }
  },
  "sort": {
    "postDate": {
      "order": "desc"
    }
  }
}

多条件搜索:

1、(&&使用 must )搜索 response_code 包含 200,并且 @timestamp 包含 "2023-09-25T12:43:46.000Z"
POST /nginx-access-log-2023.09.25/_search?pretty
{
	"query": {
		"bool": {
			"must": [{
				"match": {
					"response_code": "200"
				}
			},{
				"match": {
					"@timestamp": "2023-09-25T12:43:46.000Z"
				}
			}]
		}
	},
	"size": 100
}
示例图像
2、(|| 使用 should )搜索 response_code 包含 200,或者 @timestamp 包含 "2023-09-25T12:43:46.000Z"
POST /nginx-access-log-2023.09.25/_search?pretty
{
	"query": {
		"bool": {
			"should": [{
				"match": {
					"response_code": "200"
				}
			},{
				"match": {
					"@timestamp": "2023-09-25T12:43:46.000Z"
				}
			}]
		}
	},
	"size": 100
}
示例图像
3、(|| 使用 should )搜索 response_code 包含 200,或者 @timestamp 包含 "2023-09-25T12:43:46.000Z",或者 message 包含 "Windows",至少满足2个以上
POST /nginx-access-log-2023.09.25/_search?pretty
{
	"query": {
		"bool": {
			"should": [{
				"match": {
					"response_code": "200"
				}
			},{
				"match": {
					"@timestamp": "2023-09-25T12:43:46.000Z"
				}
			},{
				"match": {
					"message": "Windows"
				}
			}],
            "minimum_should_match": 2
		}
	},
	"size": 100
}
4、搜索 response_code 包含 200,并且 @timestamp 不包含 "2023-09-25T12:43:46.000Z"
POST /nginx-access-log-2023.09.25/_search?pretty
{
	"query": {
		"bool": {
			"must": [{
				"match": {
					"response_code": "200"
				}
			}],
			"must_not": [{
				"match": {
					"@timestamp": "2023-09-25T12:43:46.000Z"
				}
			}]
		}
	},
	"size": 100
}
示例图像
5、统计 response_code 包含 200 的有多少个
POST /nginx-access-log-2023.09.25/_count?pretty
{
	"query": {
		"bool": {
			"must": [{
				"match": {
					"response_code": "200"
				}
			}]
		}
	}
}
示例图像

3)转换

term:不分词,直接匹配字段的完整值
match:根据字段的分词器对搜索文本进行分词

1、普通match如何转换为term+should

转换前:

GET /data/_search
{
  "query": {
    "match": {
      "title": "java elasticsearch"
    }
  }
}

转换后:

GET /data/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "title": "java"
          }
        },
        {
          "term": {
            "title": "elasticsearch"
          }
        }
      ]
    }
  }
}

2、and match如何转换为term+must

转换前:

GET /data/_search
{
  "query": {
    "match": {
      "title": {
        "query": "java elasticsearch",
        "operator": "and"
      }
    }
  }
}

转换后:

GET /data/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "title": "java"
          }
        },
        {
          "term": {
            "title": "elasticsearch"
          }
        }
      ]
    }
  }
}

3、minimum_should_match如何转换

转换前:

GET /data/_search
{
  "query": {
    "match": {
      "title": {
        "query": "java elasticsearch hadoop spark",
        "minimum_should_match": "75%"
      }
    }
  }
}

转换后:

GET /data/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "title": "java"
          }
        },
        {
          "term": {
            "title": "elasticsearch"
          }
        },
        {
          "term": {
            "title": "hadoop"
          }
        },
        {
          "term": {
            "title": "spark"
          }
        }
      ],
      "minimum_should_match": 3
    }
  }
}

总结几个代词

bool:关联多个条件
must:&&
should:||
term:不分词,直接匹配字段的完整值
match:根据字段的分词器对搜索文本进行分词

posted @ 2023-09-25 15:43  yifanSJ  阅读(10713)  评论(0编辑  收藏  举报