Linux下,非Docker启动Elasticsearch 6.3.0,安装ik分词器插件,以及使用Kibana测试Elasticsearch,

Linux下,非Docker启动Elasticsearch 6.3.0

查看java版本,需要1.8版本
java -version

yum -y install java

创建用户,因为elasticsearch不能root操作
useradd panfeng

设置密码
passwd panfeng

输入123456,上面说无效小于8字符,又让输入一次,再输入123456

切换用户,带有-参数是把当前环境也切换过去
su - panfeng

这时候用ftp把elasticsearch-6.3.0.tar.gz放到/home/panfeng

退出用户 
exit

进入目录
cd /home/panfeng

查看详情
ll
总用量 89284
-rw-r--r--. 1 root root 91423553 7月   4 22:33 elasticsearch-6.3.0.tar.gz

把权限乐优
chown panfeng:panfeng elasticsearch-6.3.0.tar.gz

再查看详情
ll
总用量 89284
-rw-r--r--. 1 panfeng panfeng 91423553 7月   4 22:33 elasticsearch-6.3.0.tar.gz

修改文件权限
chmod 755 elasticsearch-6.3.0.tar.gz

再次查看详情,这时的elasticsearch-6.3.0.tar.gz就会变为绿色
ll
总用量 89284
-rwxr-xr-x. 1 panfeng panfeng 91423553 7月   4 22:33 elasticsearch-6.3.0.tar.gz

切换用户
su - panfeng

解压文件
tar -zxvf elasticsearch-6.3.0.tar.gz

修改解压后的文件夹名称为elasticsearch
mv elasticsearch-6.3.0 elasticsearch

进入目录
cd elasticsearch

查看详:bin执行的脚本,config配置,lib依赖,logs日志,modules模块,plugins插件
ll

进入目录
cd config

查看详情,elasticsearch.yml是elasticsearch的核心配置文件,jvm.options是Java虚拟机参数
ll

编辑Java虚拟机参数
vim jvm.options

把22和23行的1g改为512m 输入 I 插入进行编辑,编辑好之后按 Esc 输入:wq 保存并退出

编辑elasticsearch核心配置文件elasticsearch.yml
vim elasticsearch.yml

把33行 数据目录位置改为 path.data: /home/panfeng/elasticsearch/data
把37行 日志目录位置改为 path.logs: /home/panfeng/elasticsearch/logs
把55行 修改绑定的ip,默认只允许本机访问,修改为0.0.0.0后则可以远程访问,改为 network.host: 0.0.0.0
Elasticsearch的插件要求至少3.5以上版本,这里最好禁用这个插件,修改elasticsearch.yml文件，在最下面添加如下配置：在文件最下面另起一行 添加 bootstrap.system_call_filter: false
输入 I 插入进行编辑,编辑好之后按 Esc 输入:wq 保存并退出

退出用户
exit

修改文件权限
vim /etc/security/limits.conf

在# End of file上面添加下面四行数据

* soft nofile 65536

* hard nofile 131072

* soft nproc 4096

* hard nproc 4096

输入 I 插入进行编辑,编辑好之后按 Esc 输入:wq 保存并退出

修改线程数
vim /etc/security/limits.d/90-nproc.conf

*       soft    nproc    4096
root    soft    nproc    unlimited

如果有和两行代码直接把*对应的改为4096就行了,如果没有就直接添加
输入 I 插入进行编辑,编辑好之后按 Esc 输入:wq 保存并退出

修改虚拟内存
vim /etc/sysctl.conf

添加vm.max_map_count=655360 如果有就修改
输入 I 插入进行编辑,编辑好之后按 Esc 输入:wq 保存并退出

修改虚拟内存生效
sysctl -p

如果显示 vm.max_map_count = 655360 就修改成功了~

进入目录
cd /home/panfeng/elasticsearch

创建data目录,logs目录已经存在就不用创建了
mkdir data

进入目录
cd /home/panfeng/elasticsearch/bin/

运行elasticsearch
./elasticsearch

这时候在Windows浏览器输入 虚拟机ip:9200 来访问是否启动成功

Linux下,非Docker启动Elasticsearch 6.3.0,操作过程

安装ik分词器插件,以及使用Kibana测试Elasticsearch

用ftp上传elasticsearch-analysis-ik-6.3.0.zip到/home/panfeng/elasticsearch/plugins/

进入目录
cd /home/panfeng/elasticsearch/plugins/

使用unzip解压ik分词器
unzip elasticsearch-analysis-ik-6.3.0.zip -d ik-analyzer

删除elasticsearch-analysis-ik-6.3.0.zip,因为这个是插件目录,这个zip文件会解析错误
rm -f elasticsearch-analysis-ik-6.3.0.zip

Windows下解压kibana
kibana-6.3.0-windows-x86_64.zip

解压后,进入安装目录下的config目录,修改kibana.yml文件
我的虚拟机地址192.168.1.104,所以第28行修改为 elasticsearch.url: "http://192.168.1.104:9200"

进入安装目录下的bin目录,双击运行kibana.bat,第一次运行慢,等待一会,如果几分钟还是不行的话,就再关闭窗口,再重新双击运行kibana.bat

安装ik分词器插件,以及使用Kibana测试Elasticsearch

先用RestClient测试

请求方式:PUT
请求路径:/索引库名
请求参数:json格式

{
    "settings": {
        "number_of_shards": 3,
        "number_of_replicas": 2
      }
}

settings:索引库的设置
   number_of_shards:分片数量
   number_of_replicas:副本数量

发送
响应

Kibana操作Elasticsearch

操作索引

创建索引

查看索引设置

查看指定索引
GET /索引库名

查看所有所有
GET *

删除索引
```
DELETE /索引库名
```

映射配置

创建映射字段

PUT /索引库名/_mapping/类型名称
{
  "properties": {
    "字段名": {
      "type": "类型",
      "index": true，
      "store": true，
      "analyzer": "分词器"
    }
  }
}

类型名称:就是前面将的type的概念,类似于数据库中的不同表
字段名:任意填写,可以指定许多属性,例如:
type:类型,可以是text,long,short,date,integer,object等,String的text可以分词,String的keyword不可以分词
index:是否索引,默认为true
store:是否存储,默认为false,默认保存到_source
analyzer:分词器,这里的`ik_max_word`即使用ik分词器,固定写法

查看映射信息
```
GET /索引库名/_mapping
```

字段属性详解

type

- String类型，又分两种：
  - text：可分词，不可参与聚合
  - keyword：不可分词，数据会作为完整字段进行匹配，可以参与聚合

- Numerical：数值类型，分两类
  - 基本数据类型(一般使用long,interger)：long、interger、short、byte、double、float、half_float
  - 浮点数的高精度类型：scaled_float
    - 需要指定一个精度因子，比如10或100。elasticsearch会把真实值乘以这个因子后存储，取出时再还原。

- Date：日期类型
  elasticsearch可以对日期格式化为字符串存储，但是建议我们存储为毫秒值，存储为long，节省空间。

index

index影响字段的索引情况。
- true：字段会被索引，则可以用来进行搜索。默认值就是true
- false：字段不会被索引，不能用来搜索

index的默认值就是true，也就是说你不进行任何配置，所有字段都会被索引。
但是有些字段是我们不希望被索引的，比如商品的图片信息，就需要手动设置index为false。

store

是否将数据进行额外存储。

在学习lucene和solr时，我们知道如果一个字段的store设置为false，那么在文档列表中就不会有这个字段的值，用户的搜索结果中不会显示出来。

但是在Elasticsearch中，即便store设置为false，也可以搜索到结果。
原因是Elasticsearch在创建文档索引时，会将文档中的原始数据备份，保存到一个叫做`_source`的属性中。而且我们可以通过过滤`_source`来选择哪些要显示，哪些不显示。
而如果设置store为true，就会在`_source`以外额外存储一份数据，多余，因此一般我们都会将store设置为false，事实上，**store的默认值就是false。**

新增数据

随机生成id
```
POST /索引库名/类型名
{
    "key":"value"
}
```
_source：源文档信息，所有的数据都在里面。
_id：这条文档的唯一标示，与文档自己的id字段没有关联

自定义id

POST /索引库名/类型/id值
{
    ...
}

添加字段,修改数据

修改必须指定id，

- id对应文档存在，则修改
- id对应文档不存在，则新增

删除数据
```
DELETE /索引库名/类型名/id值
```

*查询

基本查询

基本语法

GET /索引库名/_search
{
    "query":{
        "查询类型":{
            "查询条件":"查询条件值"
        }
    }
}


查询类型为 match_all , match , multi_match , term , terms

查询所有 match_all

GET /heima/_search
{
    "query":{
        "match_all": {}
    }
}

query:代表查询对象
match_all:代表查询所有

匹配查询 match

查询"title"内容有"大牛"的数据
GET /panfeng/_search
{
    "query":{
        "match": {
          "title": "大牛"
        }
    }
}

or关系,查询"title"内容有"大牛"或"手机"的数据,因为分词器会分词
GET /panfeng/_search
{
    "query":{
        "match": {
          "title": "大牛手机"
        }
    }
}

and关系,查询"title"内容有"大牛"并且也含有"手机"的数据,因为分词器会分词
GET /panfeng/_search
{
    "query":{
        "match": {
          "title": {
            "query": "大牛手机",
            "operator": "and"
          }
        }
    }
}

"大牛手机"可以分词"大牛","手机"两个词,匹配任何一个都可以,如果把1改为3不匹配任何
GET /panfeng/_search
{
    "query":{
        "match":{
            "title":{
                "query":"大牛手机",
                "minimum_should_match": 1
            }
        }
    }
}

"大牛智能手机"可以分词"大牛","智能","手机"三个词
最小匹配3x0.66=1.98,因为1.98<2,所以能匹配三个当中任何一个词都可以
GET /panfeng/_search
{
    "query":{
        "match":{
            "title":{
                "query":"大牛智能手机",
                "minimum_should_match": "66%"
            }
        }
    }
}

"大牛智能手机"可以分词"大牛","智能","手机"三个词
最小匹配3x0.67=2.01,因为2.01>2,所以能匹配三个当中任何两个词都可以
GET /panfeng/_search
{
    "query":{
        "match":{
            "title":{
                "query":"大牛智能手机",
                "minimum_should_match": "67%"
            }
        }
    }
}

匹配查询 match

多字段查询 multi_match

可以匹配字段"title"或"name" 内容为"大牛"的数据
GET /panfeng/_search
{
    "query":{
        "multi_match": {
            "query":    "大牛",
            "fields":   [ "title", "name" ]
        }
    }
}

多字段查询 multi_match

词条查询 term

在"title"中,可以匹配到词为"大牛"的数据
GET /panfeng/_search
{
    "query":{
        "term":{
            "title": {
              "value": "大牛"
            }
        }
    }
}

因为"大牛手机"不是一个词,所以也无法匹配到title中含有"大牛手机"的数据
因为"快快乐乐"是一个词,所以可以匹配到title中含有"快快乐乐"的数据
GET /panfeng/_search
{
    "query":{
        "term":{
            "title": {
              "value": "大牛手机"
            }
        }
    }
}

词条查询 term

多词条精确查询 terms

只能匹配到title中含有"大牛"的数据,因为"大牛"是一个词,而"二蛋"不是一个词
如果换成"title": ["大牛","牛牛"],则就可以匹配到title中含有"大牛"或"牛牛"的数据
GET /panfeng/_search
{
    "query":{
        "terms":{
            "title": ["大牛","二蛋"]
        }
    }
}

多词条精确查询 terms

_source过滤

直接指定字段

在查询结果的_source中只显示字段"title","price"
GET /panfeng/_search
{
  "_source": ["title","price"],
  "query": {
    "term": {
      "title": {
        "value": "大牛"
      }
    }
  }
}

直接指定字段

指定includes和excludes

includes:来指定想要显示的字段
GET /panfeng/_search
{
  "_source": {
    "includes":["title","price"]
  },
  "query": {
    "term": {
      "title": "大牛"
    }
  }
}

excludes:来指定不想要显示的字段
GET /panfeng/_search
{
  "_source": {
    "excludes":["title","price"]
  },
  "query": {
    "term": {
      "title": "大牛"
    }
  }
}

指定includes和excludes

结果过滤

布尔组合 bool

查询title为手机,price为2222或者3333的数据
GET panfeng/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "title": "手机"
          }
        },
        {
          "terms": {
            "price": ["2222","3333"]
          }
        }
      ]
    }
  }
}

title不为大牛并且价格不为2222或3333的数据
GET panfeng/_search
{
  "query": {
    "bool": {
      "must_not": [
        {
          "match": {
            "title": "大牛"
          }
        },
        {
          "terms": {
            "price": ["2222","3333"]
          }
        }
      ]
    }
  }
}

title为大牛或者price为2222或3333的数据
GET panfeng/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "title": "大牛"
          }
        },
        {
          "terms": {
            "price": ["2222","3333"]
          }
        }
      ]
    }
  }
}

"bool"把各种其它查询通过"must"与,"must_not"非,"should"或的方式进行组合

范围查询

在range中 gt:大于 gte:大于等于 lt:小于 lte:小于等于
大于 greater than
小于 less than
等于 equal 

查询价格大于等于3.01小于5.01的数据,不可以匹配3,可以匹配3.01,可以匹配5,不可以匹配5.01
GET /panfeng/_search
{
    "query":{
        "range": {
            "price": {
                "gte":  3.01,
                "lt":   5.01
            }
        }
    }
}

在range中 gt:大于 gte:大于等于 lt:小于 lte:小于等于

模糊查询

高级查询
排序

posted on 2019-07-04 16:04 陶攀峰阅读(515) 评论(0) 编辑收藏举报

Linux下,非Docker启动Elasticsearch 6.3.0,安装ik分词器插件,以及使用Kibana测试Elasticsearch,

Linux下,非Docker启动Elasticsearch 6.3.0

安装ik分词器插件,以及使用Kibana测试Elasticsearch

先用RestClient测试

Kibana操作Elasticsearch

操作索引

创建索引

查看索引设置

删除索引

映射配置

创建映射字段

查看映射信息

字段属性详解

新增数据

随机生成id

自定义id

添加字段,修改数据

删除数据

*查询

基本查询

基本语法

查询所有 match_all

匹配查询 match

多字段查询 multi_match

词条查询 term

多词条精确查询 terms

_source过滤

直接指定字段

指定includes和excludes

结果过滤

布尔组合 bool

范围查询

模糊查询

高级查询

排序

1

1

1

1

1

1

1

1

1

1

1

1

1

1