Elasticsearch搜索资料汇总

Elasticsearch（ES）是近实时的分布式搜索分析引擎。这篇文章整理和筛选了ES相关资料，包括索引、分词、多条件查询、聚合、自动补全、建议词、同义词、安全性等等，便于大家学习和使用ES搜索引擎。

Elasticsearch 简介

Elasticsearch（ES）是一个基于Lucene 构建的开源分布式搜索分析引擎，可以近实时的索引、检索数据。具备高可靠、易使用、社区活跃等特点，在全文检索、日志分析、监控分析等场景具有广泛应用。

lucene

Lucene介绍与入门使用

Lucene.Net 文档

Lucene 可视化工具Luke

Elasticsearch 中文社区：https://elasticsearch.cn/article/

Elasticsearch 官方文档：https://www.elastic.co/guide/index.html

Elasticsearch 各客户端API（eg：.NET、JAVA、Python、Go）

Elasticsearch .net client NEST 5.x 使用总结（初始化、查询、权重、排序、聚合等）

Elasticsearch 客户端SDK使用建议：创建索引的Setting和mapping使用elasticsearch 提供的DSL语法更加简单。因为客户端API代码里面只提供基础的SDK，如（ik拼音等）插件就没有对应接口提供

Elasticsearch术语（索引、类型、文档、集群、节点、分片）

ES数据架构的主要概念（与关系数据库Mysql对比）

在ES 早期版本，一个索引下是可以有多个Type 。从6.0 开始，一个索引只有一个Type，即_doc（查询语句中也不要包含type）。一个Type 下的文档，都有相同的字段（Field）

查询语句：

GET [index]/[type]/_search
变更为
GET [index]/_search

安装

docker版本的ELK快速部署

ELK

ELK 是elastic 公司旗下三款产品ElasticSearch 、Logstash 、Kibana 的首字母组合。

#、ElasticSearch 是一个基于Lucene 构建的开源，分布式，RESTful 搜索引擎。

#、Logstash 传输和处理你的日志、事务或其他数据。

#、Kibana 将Elasticsearch 的数据分析并渲染为可视化的报表。

Kibana User Guide

es-head可视化插件

docker安装elasticsearch和head插件

Elasticsearch Head 数据浏览406

分词器

分词器是专门处理分词的组件，分词器由如下三部分组成：

1、Character Filters：针对原始文本处理，比如：去除html 标签

2、Tokenizer：按照规则切分为单词，比如：按照空格切分

3、Token Filters：将切分的单词进行加工，比如：大写转小写，删除stopwords，拼音，同义词等

analyzer = CharFilters（0个或多个）+ Tokenizer(一个) + TokenFilters(0个或多个)

从图中能够看出，从上到下依次通过Character Filters，Tokenizer 以及Token Filters，这个顺序比较好理解，一个文本进来确定要先对文本数据进行处理，再去分词，最后对分词的结果进行过滤。

ElasticSearch 分词器是什么

一些分词器介绍（比如适用于英语的Snowball ）

elasticSearch Analysis Token Filters作用及相关样例

Writing analyzers

ElasticSearch查看字段分词结果（便于查为什么匹配不出的问题）

Elasticsearch7 分词器(内置分词器和自定义分词器)

Elasticsearch-Analysis-IK中文分词器配置使用

elasticsearch 之分词器配置 (IK+pinyin)

Elasticsearch 使用ik中文分词器增加分词热词（自定义词）

Elasticsearch mapping

搞懂Elasticsearch 之Mapping （Reindex）

ElasticSearch 使用null_value处理空值

Mapping中的store属性（按需查询字段）

Elasticsearch中的store field跟non-store field的区别

Elasticsearch 理解mapping中的store属性

Elasticsearch 动态模板(dynamic_templates)

normalizer 的使用

ElasticSearch Normalizer 的使用方法

elasticsearch大小写无法使用term查询的问题

Adding normalizer for all keyword fields NEST

Elasticsearch DLS语法

Elasticsearch 查询语法（模糊、精确、sort、相关性、and|or、slop间隔等）

Elasticsearch 查询语法（多条件bool复杂查询（must、should、filter）、日期范围查询）

Elasticsearch 查询语法（bool复杂查询、operator（||、&&、!、+）)

Elasticsearch 组合多查询(bool, must, should, must_not, filter)

Elasticsearch 多字符串多字段查询，权重

Elasticsearch中match、match_phrase、query_string和term的区别

Elasticsearch filter和query的不同

ElasticSearch 多级排序（eg：产品要根据：销量、热度、相关性排序）

Elasticsearch 搜索条件权重控制（boost）-- 默认情况下，搜索条件的权重都是1

聚合查询

Elasticsearch 聚合语法（Aggregations）

Elasticsearch 聚合查询

通过Elasticsearch 实现聚合检索(分组统计)

Elasticsearch 范围查询（数值、日期）

分页查询

Elasticsearch 分页查询

Elasticsearch 查询语法（使用scroll响应式返回大集合文档）

Elasticsearch 嵌套查询，父子关系查询

Elasticsearch 高亮显示匹配关键词（Highlight）

同义词

elasticsearch 使用同义词（synonym.txt）

搜索建议词（Suggest功能）

Elasticsearch实现搜索推荐词（C#）

基于Elasticsearch实现搜索推荐

ElasticSearch使用completion实现补全功能

Elasticsearch Suggester详解（自动补全）

Elasticsearch搜索Suggest功能优化

elasticsearch 7.0 新特性之 search as you type

模拟实战京东搜索效果（一）

模拟实战京东搜索效果（二）

安全性

Meow攻击删除开放的的Elasticsearch（及MongoDB）索引，建一堆以Meow结尾的奇奇怪怪的索引（如：m3egspncll-meow）----关闭外网访问端口，或至少修改ES默认端口

用nginx给kibana、elasticsearch做权限认证

集中式日志分析平台- ELK Stack - 安全解决方案 X-Pack

elasticsearch7.8权限控制和规划（版本7开始，x-pack部分安全功能可以免费使用）

常用的es语句

版本：Elasticsearch 7.9.0

在线kibana：http://134.175.121.78:5601/app/dev_tools#/console

（是我自己的服务器搭建的，请大家友好的体验）

删除索引

DELETE mall.completion

创建索引，并指定settings

PUT mall.completion

{

"settings":{

"analysis":{

"analyzer":{

"ik_smart_pinyin":{

"type":"custom",

"tokenizer":"ik_smart",

"filter":["g_pinyin","word_delimiter"]

"ik_max_word_pinyin":{

"type":"custom",

"tokenizer":"ik_max_word",

"filter":["g_pinyin","word_delimiter"]

}

"filter":{

"g_pinyin":{

"type":"pinyin",

"keep_separate_first_letter":false,

"keep_full_pinyin":true,

"keep_original":true,

"limit_first_letter_length":16,

"lowercase":true,

"remove_duplicated_term":true

}

"mappings": {

"properties": {

"kw_completion": {

"type": "completion"

"kw_text":{

"type": "text",

"analyzer": "ik_smart_pinyin"

}

查看索引设置

GET mall.completion/_settings

查看mapping结构

GET mall.completion/_mapping

批量插入数据

POST _bulk/?refresh=true