Elasticsearch6.0简介入门介绍
Elasticsearch简单介绍
Elasticsearch (ES)是一个基于Lucene构建的开源、分布式、RESTful 接口全文搜索引擎。Elasticsearch 还是一个分布式文档数据库(存放的JSON格式的),其中每个字段均是被索引的数据且可被搜索(京东的搜索数据商品 细节 相关都可以被搜索到),它能够扩展至数以百计的服务器存储以及处理PB级的数据。它可以在很短的时间内在储、搜索和分析大量的数据。它通常作为具有复杂搜索场景情况下的核心发动机。
Elasticsearch就是为高可用和可扩展而生的。可以通过购置性能更强的服务器来完成。
官网:https://www.elastic.co/downloads/elasticsearch
中文社区https://es.xiaoleilu.com/
什么是PB级别https://baike.baidu.com/item/PetaByte/5910820
ElastiJob---XXL-JOB
补充 ElasticJob 类似于 xxl-job 分布式任务调度平台
Elasticsearch优势
横向可扩展性:只需要增加台服务器,做一点儿配置,启动一下Elasticsearch就可以并入集群。容易加入进集群
分片机制提供更好的分布性:同一个索引分成多个分片(sharding), 这点类似于HDFS的块机制;分而治之的方式可提升处理效率。
高可用:提供复制( replica) 机制,一个分片可以设置多个复制,使得某台服务器在宕机的情况下,集群仍旧可以照常运行,并会把服务器宕机丢失的数据信息复制恢复到其他可用节点上。
口使用简单:共需一条命令就可以下载文件,然后很快就能搭建一一个站内搜索引擎。
Elasticsearch应用场景
大型分布式日志分析系统ELK elasticsearch(存储日志)+logstash(收集日志)+kibana(展示数据)
电商中某个模块需要做搜索,或者做分布式日志收集。
大型电商商品搜索系统、网站站内搜索、网盘搜索引擎等。
Elasticsearch使用公司
维基百科
The Guardian(国外新闻网站)
Stack Overflow(国外的程序异常讨论论坛)
GitHub(开源代码管理)
电商网站
日志数据分析
BI系统
站内搜索
Elasticsearch存储结构
Elasticsearch是文件存储,Elasticsearch是面向文档型数据库,一条数据在这里就是一个文档,用JSON作为文档序列化的格式,比如下面这条用户数据:
{ "name" : "toov5", "sex" : 0, "age" : 25 } |
与关系型数据库的比较:
关系数据库: ⇒ 数据库 ⇒ 表 ⇒ 行 ⇒ 列(Columns)
Elasticsearch: ⇒ 索引(Index) ⇒ 类型(type,类似于数据表结构) ⇒ 文档(Docments,类似于这一条数据) ⇒ 字段(Fields)
对于入门来说,要学习的有:
1、Elasticsearch应用场景
2、安装kibana可视化插件
3、Kibana平台增删改查
4、Elasticsearch乐观锁版本控制
5、Elasticsearch底层原理实现
6、Elasticsearch Mapping映射
7、深入Elasticsearch搜索查询
8、Elasticsearch索引分词器
9、使用分布式日志日志收集ELK
SpringBoot2.0整合ElasticSearch 很简单的!!