Linux配置 ElasticSearch

一、什么是ElasticSearch?

一、什么是ES?
        ES是一个分布式使用RestFul风格的数据搜索引擎,并且ES是构建在Lucene框架之上,也就是说ES也是基于Lucene进行开发的搜索引擎框架
    /*    ES三大核心:
            Index
                相当于关系型数据库中的库
            Type
                相当于关系型数据库中的表
            Document
                相当于关系型数据库中的表数据
    */
    
    !!!6.ES是基于Lucene开发的,但是Lucene和ES都是搜索引擎框架
        什么时候使用ES
        什么时候使用Lucene
        
    //    Lucene和ES的区别是什么?
            Lucene只是一个搜索架构,不能直接使用,如果需要使用Lucene则需要自己添加代码来实现搜索模块,也就是说必须要根据公司的业务逻辑来进行编码搜索代码
            ES已经把这些代码全部实现了(在Lucene基础上实现的),可以直接使用不再需要添加任何和架构有关的代码
            
        Lucene是当公司的需求比较繁琐,而且ES无法满足的时候才需要自己去编写Lucene的架构代码实现搜索功能,但是学习成本比较高
        ES几乎支持了市面上中小型企业的搜索需求,只要公司的业务搜索需求可以用ES来实现,就直接可以使用,不需要再自己对Lucene进行编码,实现起来非常简单,不需要学习成本,直接调用API就可以

 

 

二、如何在Linux上配置ElasticSearch?

二、ES的配置?
    ElasticSearch 是一个分布式、高扩展、高实时的搜索与数据分析引擎。
    ES是apache公司的,所以必须要配置jdk
    ES不要用最新版,因为ES的最新版必须要求jdk在11版本以上
    但是目前市面上所有的公司全部都在jdk8或者以下

    
        1.在linux上配置ES
        
        2配置jdk
            也可以从之前配置过的虚拟机中copy过来。。。
        
        3从官网中下载ES
        
        4.解压es的压缩包
            tar -zxvf es....
                !!!!!从3.4--->3.6不要求手动输入,推荐使用复制粘贴!!!!
        
        
    
        5.使用系统用户 修改一些配置。。。
        
        6.增大linux上部署软件的内存和硬盘
            以下的配置一定要使用root用户(root的权限是最大的),否则没有权限或者配置不生效
            (不要求手写,直接复制即可)
            
            //使用root用户 配置 
            
        7    vim /etc/security/limits.conf
            /*
                vim /etc/security/limits.conf
            
            */
            
            
            配置了某个用户/某些用户对软件的内存和硬盘使用权限
    /*        * soft nproc 655350
            * soft nofile 655350
            * hard nproc 655350
            * hard nofile 655350
        */

 

 

 

 

 

8最大线程数
        (ES一般情况是以集群启动,所以目前的用户无法满足ES所要创建的线程,所以需要加大线程数)
        这里只是配置系统可容纳最大的线程数,默认系统都有自动保护,不会开启很大的线程数,需要手动修改
            
            vim /etc/sysctl.conf
        /*
            vim /etc/sysctl.conf
            
            vm.max_map_count=262144
        */    
        

 

 

 

    
        9配置用户最大的线程数
            vim /etc/security/limits.d/90-nproc.conf
        /*
            vim /etc/security/limits.d/90-nproc.conf
            vim /etc/security/limits.d/90-nproc.conf
            vim /etc/security/limits.d/90-nproc.conf
            vim /etc/security/limits.d/90-nproc.conf
        
        */    
            
            需要把* 1024--->4096

10.使修改永久生效。
    sysctl -p

 

 

 

 

        
    启动     ./elasticsearch  需要切换用户  
    
    11创建用户的命令:
    /*
        adduser 名字
        passwd   
        
        
        useradd 名字
        passwd 
    
    */


    12.给用户授权的命令:
    //        chown -R esuser  /home/apps/elasticsearch-6.4.0/
    /*
        chown -R esuser 需要授权的路径
        
        chown -R esuser /home/apps/elasticsearch-6.4.0/
        chown -R esuser /home/apps/elasticsearch-xxxx
        chown -R esuser /home/apps/elasticsearch-xxxx
        
    */
    
    
    !!!注意一定要给用户授权 ,否则会报错

    
    你如果想要用esuser  用户登录   就需要给他赋予权限。。。。
    需要对 esuesr 用户进行授权的操作。。。


    
    13.切换用户 ? 为什么?  
    1.ES为了自我保护,不让使用root用户启动,因为root用户权限过大,容易修改ES自己配置
        /*
            su 需要切换的用户名。
            su esuser 
            su haha
            su xixi
            
    
        */
    14直接启动es
            在bin目录
            ./elasticsearch
            报错!!!!  

 

        
    15修改elasticSeach.yml配置文件即可
        
    //在conf
            # 修改集群名字(名字随便起,没有什么意义)
            cluster.name: my-cluster
            
            # 如果是单节点(名字随便起,如果是集群则不能重复)
            node.name: node-1
            
            # ES所存放数据的位置(默认data目录不存在,需要自己手动创建  mkdir data   cd data  pwd 获得路径!)
            path.data: /home/apps/elasticsearch-6.4.0/data
            
            # ES的日志存放目录(默认已经存在,直接使用即可,不需要创建)
            path.logs: /home/apps/elasticsearch-6.4.0/logs
            
            # 放开ES的内存锁,让ES直接拥有最大内存使用权
            bootstrap.memory_lock: false
            
            # centos6中没有CONFIG_SECCOMP_FILTER,但是centos7中有,如果linux系统为centos6则需要关闭过滤
            bootstrap.system_call_filter: false
            
            # ES的主机地址(一旦配置的是0,就是代表所有的电脑都可以连接(对连接不再造成任何限制))
            network.host: 192.168.23.136(0.0.0.0)
            
            # ES的默认端口号(./elasticsearch -d(启动的是ES的控制台))
            http.port: 9200
            
            # 识别其他的集群host(如果为单节点只需要写一个)
            discovery.zen.ping.unicast.hosts: ["192.168.132.141"]
            
            多个的写法。。。
            discovery.zen.ping.unicast.hosts: ["192.168.23.136","",""]

 

 

    16.启动ES
            进入bin目录
            ./elasticsearch
        /*
            ./elasticsearch
            ./elasticsearch 
            ./elasticaearch
            
        */    
        
    3.11.浏览器中检测是否启动成功
            使用浏览器访问ip:端口号
            http://192.168.132.141:9200/
            {
              "name" : "node-1",
              "cluster_name" : "my-cluster",
              "cluster_uuid" : "UmoHkEZzReGQMrrLShhDIQ",
              "version" : {
                "number" : "6.4.0",
                "build_flavor" : "default",
                "build_type" : "tar",
                "build_hash" : "595516e",
                "build_date" : "2018-08-17T23:18:47.308994Z",
                "build_snapshot" : false,
                "lucene_version" : "7.4.0",
                "minimum_wire_compatibility_version" : "5.6.0",
                "minimum_index_compatibility_version" : "5.0.0"
              },
              "tagline" : "You Know, for Search"
            }

    4.    关闭 elasticsearch 进程?
        4.1 查找es 的进程号
        //    ps -ef |grep elastic
        
        ps -ef |grep elastic
        kill -9 7167
            
        // kill -9 5866(端口号)
        
        4.2 重启?
            在 bin目录下 执行命令
            sh elasticsearch -d
            

 

 

五、配置ES所遇到的问题:

1.ES为了自我保护,不让使用root用户启动,因为root用户权限过大,容易修改ES自己配置
        创建新的用户并且授权
        useradd esuser
        passwd esuser ---> 123456
        
        授权:
            chown -R esuser /home/apps/elasticsearch
            
    2.因为ES需要消耗非常大的线程数量和内存以及硬盘存储空间
        [1]: max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536]
        [1]:当前启动用户无法对linux系统调动很多的硬盘以及内存存储空间,所以需要自行修改!
        vi /etc/security/limits.conf
        
        [2]: max number of threads [1024] for user [esuser] is too low, increase to at least [4096]
        [2]:当前启动的用户太low了,无法调动很多的线程(默认只能调动1024)
            vi /etc/secrity/limits.d/90-nproc.conf
            
        [3]: max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]
        [3]:需要配置vim /etc/sysctl.conf文件,加大系统默认的总线程数
        
    3.使用创建出新用户启动没有问题,但是当使用root用户启动一次后,再使用新创建的用户启动就有问题
        新创建的用户无法使用root用户所创建出的文件
        无论是使用哪一个用户启动都会在config文件夹中创建elasticsearch.keystore文件,root用户权限太大,创建的文件其他用户无法使用,所以会报错!
        
    4.java.lang.UnsupportedOperationException: seccomp unavailable: CONFIG_SECCOMP not compiled     into kernel, CONFIG_SECCOMP and CONFIG_SECCOMP_FILTER are needed
        因为最终CONFIG_SECCOMP系统在centos7中默认会被加载,但是在centos6中没有
        需要更换centos的版本
        6---->7
        修改es的配置文件
        在yml配置文件中添加一行数据
        
        bootstrap.system_call_filter: false

 

 

 

 

六、附带.SQl语句的调优问题

1.附带.SQl语句的调优问题。
                    /*            
                    1.尽量避免非操作符的使用

                        在索引使用NOT ,<>,会导致索引失效,比如a不等于0 a<>0可以修改为 a>0 or a<0 ,NOT修改为a>0或者a>"",避免全表扫描

                    2.尽量避免使用前导模糊查询,因为前导模糊查询由%,不能利用索引,影响查询效率.

                    3.避免对查询列的操作

                        操作包含:数据库函数,计算机表达式,这样会导致全表扫描

                    4.避免不必要的类型转换

                        这里的类型转换是潜在的类型转换,比如将字符串与数字类型比较,这样会将字符串进行转换,导致全表扫描.

                    5.增加查询范围的限制
    
                        少使用*,

                    6.合理使用in与exists

                        exists是循环的方式,外表记录数代表循环的次数,外表的记录少,适合用它.

                        in先执行子查询,子查询去重之后,然后在执行主查询,子查询返回结果越少,越适合这种方式.

                        如果两张表数据一样大,那么用in和exists差别不大,但是如果不一样大,子查询小的用in,主查询小的用exists.

                    7.规范所有关键字的书写,select ,update,delete,要么全大写要不全小写
                    */

 

posted @ 2019-09-10 23:57  送外卖的小菜鸟  阅读(1487)  评论(0编辑  收藏  举报