Linux配置 ElasticSearch
一、什么是ElasticSearch?
一、什么是ES? ES是一个分布式使用RestFul风格的数据搜索引擎,并且ES是构建在Lucene框架之上,也就是说ES也是基于Lucene进行开发的搜索引擎框架 /* ES三大核心: Index 相当于关系型数据库中的库 Type 相当于关系型数据库中的表 Document 相当于关系型数据库中的表数据 */ !!!6.ES是基于Lucene开发的,但是Lucene和ES都是搜索引擎框架 什么时候使用ES 什么时候使用Lucene // Lucene和ES的区别是什么? Lucene只是一个搜索架构,不能直接使用,如果需要使用Lucene则需要自己添加代码来实现搜索模块,也就是说必须要根据公司的业务逻辑来进行编码搜索代码 ES已经把这些代码全部实现了(在Lucene基础上实现的),可以直接使用不再需要添加任何和架构有关的代码 Lucene是当公司的需求比较繁琐,而且ES无法满足的时候才需要自己去编写Lucene的架构代码实现搜索功能,但是学习成本比较高 ES几乎支持了市面上中小型企业的搜索需求,只要公司的业务搜索需求可以用ES来实现,就直接可以使用,不需要再自己对Lucene进行编码,实现起来非常简单,不需要学习成本,直接调用API就可以
二、如何在Linux上配置ElasticSearch?
二、ES的配置? ElasticSearch 是一个分布式、高扩展、高实时的搜索与数据分析引擎。 ES是apache公司的,所以必须要配置jdk ES不要用最新版,因为ES的最新版必须要求jdk在11版本以上 但是目前市面上所有的公司全部都在jdk8或者以下 1.在linux上配置ES 2配置jdk 也可以从之前配置过的虚拟机中copy过来。。。 3从官网中下载ES 4.解压es的压缩包 tar -zxvf es.... !!!!!从3.4--->3.6不要求手动输入,推荐使用复制粘贴!!!! 5.使用系统用户 修改一些配置。。。 6.增大linux上部署软件的内存和硬盘 以下的配置一定要使用root用户(root的权限是最大的),否则没有权限或者配置不生效 (不要求手写,直接复制即可) //使用root用户 配置 7 vim /etc/security/limits.conf /* vim /etc/security/limits.conf */ 配置了某个用户/某些用户对软件的内存和硬盘使用权限 /* * soft nproc 655350 * soft nofile 655350 * hard nproc 655350 * hard nofile 655350 */
8最大线程数 (ES一般情况是以集群启动,所以目前的用户无法满足ES所要创建的线程,所以需要加大线程数) 这里只是配置系统可容纳最大的线程数,默认系统都有自动保护,不会开启很大的线程数,需要手动修改 vim /etc/sysctl.conf /* vim /etc/sysctl.conf vm.max_map_count=262144 */
9配置用户最大的线程数 vim /etc/security/limits.d/90-nproc.conf /* vim /etc/security/limits.d/90-nproc.conf vim /etc/security/limits.d/90-nproc.conf vim /etc/security/limits.d/90-nproc.conf vim /etc/security/limits.d/90-nproc.conf */ 需要把* 1024--->4096
10.使修改永久生效。
sysctl -p
启动 ./elasticsearch 需要切换用户 11创建用户的命令: /* adduser 名字 passwd useradd 名字 passwd */ 12.给用户授权的命令: // chown -R esuser /home/apps/elasticsearch-6.4.0/ /* chown -R esuser 需要授权的路径 chown -R esuser /home/apps/elasticsearch-6.4.0/ chown -R esuser /home/apps/elasticsearch-xxxx chown -R esuser /home/apps/elasticsearch-xxxx */ !!!注意一定要给用户授权 ,否则会报错 你如果想要用esuser 用户登录 就需要给他赋予权限。。。。 需要对 esuesr 用户进行授权的操作。。。 13.切换用户 ? 为什么? 1.ES为了自我保护,不让使用root用户启动,因为root用户权限过大,容易修改ES自己配置 /* su 需要切换的用户名。 su esuser su haha su xixi */ 14直接启动es 在bin目录 ./elasticsearch 报错!!!!
15修改elasticSeach.yml配置文件即可 //在conf # 修改集群名字(名字随便起,没有什么意义) cluster.name: my-cluster # 如果是单节点(名字随便起,如果是集群则不能重复) node.name: node-1 # ES所存放数据的位置(默认data目录不存在,需要自己手动创建 mkdir data cd data pwd 获得路径!) path.data: /home/apps/elasticsearch-6.4.0/data # ES的日志存放目录(默认已经存在,直接使用即可,不需要创建) path.logs: /home/apps/elasticsearch-6.4.0/logs # 放开ES的内存锁,让ES直接拥有最大内存使用权 bootstrap.memory_lock: false # centos6中没有CONFIG_SECCOMP_FILTER,但是centos7中有,如果linux系统为centos6则需要关闭过滤 bootstrap.system_call_filter: false # ES的主机地址(一旦配置的是0,就是代表所有的电脑都可以连接(对连接不再造成任何限制)) network.host: 192.168.23.136(0.0.0.0) # ES的默认端口号(./elasticsearch -d(启动的是ES的控制台)) http.port: 9200 # 识别其他的集群host(如果为单节点只需要写一个) discovery.zen.ping.unicast.hosts: ["192.168.132.141"] 多个的写法。。。 discovery.zen.ping.unicast.hosts: ["192.168.23.136","",""]
16.启动ES 进入bin目录 ./elasticsearch /* ./elasticsearch ./elasticsearch ./elasticaearch */ 3.11.浏览器中检测是否启动成功 使用浏览器访问ip:端口号 http://192.168.132.141:9200/ { "name" : "node-1", "cluster_name" : "my-cluster", "cluster_uuid" : "UmoHkEZzReGQMrrLShhDIQ", "version" : { "number" : "6.4.0", "build_flavor" : "default", "build_type" : "tar", "build_hash" : "595516e", "build_date" : "2018-08-17T23:18:47.308994Z", "build_snapshot" : false, "lucene_version" : "7.4.0", "minimum_wire_compatibility_version" : "5.6.0", "minimum_index_compatibility_version" : "5.0.0" }, "tagline" : "You Know, for Search" } 4. 关闭 elasticsearch 进程? 4.1 查找es 的进程号 // ps -ef |grep elastic ps -ef |grep elastic kill -9 7167 // kill -9 5866(端口号) 4.2 重启? 在 bin目录下 执行命令 sh elasticsearch -d
五、配置ES所遇到的问题:
1.ES为了自我保护,不让使用root用户启动,因为root用户权限过大,容易修改ES自己配置 创建新的用户并且授权 useradd esuser passwd esuser ---> 123456 授权: chown -R esuser /home/apps/elasticsearch 2.因为ES需要消耗非常大的线程数量和内存以及硬盘存储空间 [1]: max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536] [1]:当前启动用户无法对linux系统调动很多的硬盘以及内存存储空间,所以需要自行修改! vi /etc/security/limits.conf [2]: max number of threads [1024] for user [esuser] is too low, increase to at least [4096] [2]:当前启动的用户太low了,无法调动很多的线程(默认只能调动1024) vi /etc/secrity/limits.d/90-nproc.conf [3]: max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144] [3]:需要配置vim /etc/sysctl.conf文件,加大系统默认的总线程数 3.使用创建出新用户启动没有问题,但是当使用root用户启动一次后,再使用新创建的用户启动就有问题 新创建的用户无法使用root用户所创建出的文件 无论是使用哪一个用户启动都会在config文件夹中创建elasticsearch.keystore文件,root用户权限太大,创建的文件其他用户无法使用,所以会报错! 4.java.lang.UnsupportedOperationException: seccomp unavailable: CONFIG_SECCOMP not compiled into kernel, CONFIG_SECCOMP and CONFIG_SECCOMP_FILTER are needed 因为最终CONFIG_SECCOMP系统在centos7中默认会被加载,但是在centos6中没有 需要更换centos的版本 6---->7 修改es的配置文件 在yml配置文件中添加一行数据 bootstrap.system_call_filter: false
六、附带.SQl语句的调优问题。
1.附带.SQl语句的调优问题。 /* 1.尽量避免非操作符的使用 在索引使用NOT ,<>,会导致索引失效,比如a不等于0 a<>0可以修改为 a>0 or a<0 ,NOT修改为a>0或者a>"",避免全表扫描 2.尽量避免使用前导模糊查询,因为前导模糊查询由%,不能利用索引,影响查询效率. 3.避免对查询列的操作 操作包含:数据库函数,计算机表达式,这样会导致全表扫描 4.避免不必要的类型转换 这里的类型转换是潜在的类型转换,比如将字符串与数字类型比较,这样会将字符串进行转换,导致全表扫描. 5.增加查询范围的限制 少使用*, 6.合理使用in与exists exists是循环的方式,外表记录数代表循环的次数,外表的记录少,适合用它. in先执行子查询,子查询去重之后,然后在执行主查询,子查询返回结果越少,越适合这种方式. 如果两张表数据一样大,那么用in和exists差别不大,但是如果不一样大,子查询小的用in,主查询小的用exists. 7.规范所有关键字的书写,select ,update,delete,要么全大写要不全小写 */