一、搜索引擎知识和搜索框架elasticsearch(es)基本介绍
1. 简介:通过京东电商 介绍什么是搜索引擎,和开源搜索框架ElasticSearch6.x新特性介绍
前言:介绍ES的主要特点和使用场景,新特性讲解
mysql:like 模糊,性能问题,(数据量大起来查询太慢)
Lucene是apache搜索框架
solr:针对企业,数据量G级别
elasticsearch:针对数据量特别大,PB,TB
elasticsearch 使用场景:1.GitHub搜索 2.维基百科 3.Stack Overflow 搜索
注意: solr 和elasticsearch底层都是基于Lucene
elasticsearch是 纯java开发,springboot使用,5.6版本的elasticsearch即可
因为 es升级4->5版本,改动大,但是5版本后,改动不大
优点:不用担心性能问题
2. elasticSearch主要特点
1)、特点:全文检索,结构化检索,数据统计、分析,接近实时处理,分布式搜索(可部署数百台服务器),处理PB级别的数据
搜索纠错,自动完成
2)、使用场景:日志搜索,数据聚合,数据监控,报表统计分析
3)、国内外使用者:维基百科,Stack Overflow,GitHub
新特性讲解
1、6.2.x版本基于Lucene 7.x,更快,性能进一步提升,对应的序列化组件,升级到Jackson 2.8
2、推荐使用5.0版本推出的Java REST/HTTP客户端,依赖少,比Transport使用更方便,在基准测试中,性能并不输于Transport客户端,
在5.0到6.0版本中,每次有对应的API更新, 文档中也说明,推荐使用这种方式进行开发使用,所有可用节点间的负载均衡
在节点故障和特定响应代码的情况下进行故障转移,失败的连接处罚(失败的节点是否重试取决于失败的连续次数;失败的失败次数越多,客户端在再次尝试同一节点之前等待的时间越长)
3、(重要)不再支持一个索引库里面多个type,6.x版本已经禁止一个index里面多个type,所以一个index索引库只能存在1个type
怎么理解index,type?
数据库: mysql: database(库) table(表) rocord(字段):一个库对应多个表,每个表有多个字段
elasticSearch: index (相当于库) type(相当于表只能存在一个) document
官方文档:
1、6.0更新特性
https://www.elastic.co/guide/en/elasticsearch/reference/6.0/release-notes-6.0.0.html#breaking-java-6.0.0
2、6.1更新特性
https://www.elastic.co/guide/en/elasticsearch/reference/6.1/release-notes-6.1.0.html
二、快熟部署ElastcSearch5.6.x
1.简介:讲解为什么不用ES6.x版本,及本地快速安装ElasticSeach和场景问题处理
配置JDK1.8
2. linux服务器去部署
使用wget 下载elasticsearch安装包
wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.6.8.tar.gz
解压
tar -zxvf elasticsearch-5.6.8.tar.gz
3.下载elasticsearch
官网:https://www.elastic.co/products/elasticsearch
1)
2)
3)
4)我这里选择5.6.8
安装启动在linux系统:官网
4.外网访问配置:
config目录下面elasticsearch.yml
修改为 network.host: 0.0.0.0
5.配置es出现相关问题处理(阿里云、腾讯云,亚马逊云安装问题集合):
1、问题一
Java HotSpot(TM) 64-Bit Server VM warning: INFO: os::commit_memory(0x00000000c5330000, 986513408, 0) failed; error='Cannot allocate memory' (errno=12) # # There is insufficient memory for the Java Runtime Environment to continue. # Native memory allocation (mmap) failed to map 986513408 bytes for committing reserved memory. # An error report file with more information is saved as: # /usr/local/software/temp/elasticsearch-6.2.2/hs_err_pid1912.log
解决:内存不够,购买阿里云的机器可以动态增加内存
2、问题二
[root@iZwz95j86y235aroi85ht0Z bin]# ./elasticsearch [2018-02-22T20:14:04,870][WARN ][o.e.b.ElasticsearchUncaughtExceptionHandler] [] uncaught exception in thread [main] org.elasticsearch.bootstrap.StartupException: java.lang.RuntimeException: can not run elasticsearch as root at org.elasticsearch.bootstrap.Elasticsearch.init(Elasticsearch.java:125) ~[elasticsearch-6.2.2.jar:6.2.2] at org.elasticsearch.bootstrap.Elasticsearch.execute(Elasticsearch.java:112) ~[elasticsearch-6.2.2.jar:6.2.2] at org.elasticsearch.cli.EnvironmentAwareCommand.execute(EnvironmentAwareCommand.java:86) ~[elasticsearch-6.2.2.jar:6.2.2] at org.elasticsearch.cli.Command.mainWithoutErrorHandling(Command.java:124) ~[elasticsearch-cli-6.2.2.jar:6.2.2]
解决:用非root用户
添加用户:useradd -m 用户名 然后设置密码 passwd 用户名
3、问题三
./elasticsearch
Exception in thread "main" java.nio.file.AccessDeniedException: /usr/local/software/temp/elasticsearch-6.2.2/config/jvm.options
解决:权限不够 chmod 777 -R 当前es目录
常见配置问题资料:https://www.jianshu.com/p/c5d6ec0f35e0
三、ElasticSearch5.6.8测试数据准备
简介: ElasticSearch5.6.x简单测试
1、步骤 https://www.elastic.co/guide/en/elasticsearch/reference/5.6/index.html
2、使用POSTMAN 工具
启动ElasticSearch5.6 在bin下
命令: ./elasticsearch
查看集群状态:localhost:9200/_cat/health?v
注意目前没有创建索引
1)创建索引
再访问 索引customer有了
2)索引添加type
四、SpringBoot2.x整合elasticsearch5.6.x
简介:SpringBoot2.x整合elasticSearch5.6.8实战
Spring Data Elasticsearch文档地址
https://docs.spring.io/spring-data/elasticsearch/docs/3.0.6.RELEASE/reference/html/
Spring Data是整合框架的中间件
版本说明:SpringBoot整合elasticsearch
https://github.com/spring-projects/spring-data-elasticsearch/wiki/Spring-Data-Elasticsearch---Spring-Boot---version-matrix
springboot版本最好和ES版本对应,否则可能容易出现兼容问题
1、添加maven依赖
1 <dependency> 2 <groupId>org.springframework.boot</groupId> 3 <artifactId>spring-boot-starter-data-elasticsearch</artifactId> 4 </dependency>
2、接口继承ElasticSearchRepository,里面有很多默认实现
注意点:
索引名称记得小写,类属性名称也要小写
新建实体对象article
加上类注解 @Document(indexName = "blog", type = "article")
1)建立一个实体类,将数据存到elasticsearch服务器
2)接口继承ElasticSearchRepository
3)Repository源码
4)@Component 源码
5)ElasticsearchRepository<Article, Long>源码
6)实现接口后配置
7)写controller
查看es数据
8) 查看索引信息:http://localhost:9200/_cat/indices?v
启动es服务,启动工程,先访问路径http://localhost:8080/api/v1/article就是保存数据到es再用postman查看索引
注意:@Document(indexName = "blog", type = "article")
没有indexName 和type保存执行后自动创建
3、QueryBuilder使用(es里面的搜索API)
https://www.elastic.co/guide/en/elasticsearch/client/java-api/1.3/query-dsl-queries.html
//单个匹配,搜索name为jack的文档
QueryBuilder queryBuilder = QueryBuilders.matchQuery("title", "搜");
比如title是:springboot整合elasticsearch,这个是新版本 2018
启动工程后,也可以用postman访问
注意
补充:多个匹配查询
https://www.elastic.co/guide/en/elasticsearch/client/java-api/1.3/query-dsl-queries.html