随笔分类 -  Elasticsearch

摘要:网络设置 Elasticsearch 缺省情况下是绑定 localhost。对于本地开发服务是足够的(如果你在相同机子上启动多个节点,它还可以形成一个集群),但是你需要配置基本的网络设置,为了能够在实际的多服务器生产集群中运行。WARNING:注意网络配置,永远不要暴露未受保护的节点到公网上 常用的 阅读全文
posted @ 2020-12-09 08:52 天~宇~翱~翔 阅读(842) 评论(0) 推荐(0) 编辑
摘要:1. 集群健康状况处理 当集群处于yellow或者red状态的时候,整体处理步骤如下: (1) 首先查看集群状态 { "cluster_name": "elasticsearch", "status": "yellow", "timed_out": false, "number_of_nodes": 阅读全文
posted @ 2019-07-07 22:58 天~宇~翱~翔 阅读(5456) 评论(0) 推荐(0) 编辑
摘要:1. 获取子聚合结果总数 { "size": 0, "aggs": { "msisdnAgg": { "terms": { "field": "msisdn" }, "aggs": { "tagAggs": { ... 阅读全文
posted @ 2019-02-24 22:35 天~宇~翱~翔 阅读(591) 评论(0) 推荐(0) 编辑
摘要:推荐阅读:1、阿里:https://elasticsearch.cn/article/61712、滴滴:http://t.cn/EUNLkNU3、腾讯:http://t.cn/E4y9ylL4、携程:https://elasticsearch.cn/article/62055、社区:https:// 阅读全文
posted @ 2018-12-24 22:20 天~宇~翱~翔 阅读(288) 评论(0) 推荐(0) 编辑
摘要:转自 : https://blog.csdn.net/napoay/article/details/62233031 1. 概述 Elasticsearch中有几个关键属性容易混淆,很多人搞不清楚_source字段里存储的是什么?store属性的true或false和_source字段有什么关系?s 阅读全文
posted @ 2018-12-24 21:50 天~宇~翱~翔 阅读(14357) 评论(2) 推荐(5) 编辑
摘要:1. 工具安装 2. 工具使用 3. 注意事项 3.1 3.2 如果网络情况不好,或者没有网络还可以先备份到文件: 阅读全文
posted @ 2018-12-23 20:27 天~宇~翱~翔 阅读(6933) 评论(0) 推荐(2) 编辑
摘要:我们可以设置集群的平衡参数来暂时禁用掉平衡,具体步骤如下: 1.如果可能的话,先暂停掉数据新增和更新操作,这样会提高集群恢复的时间; 2.禁用集群分片平衡操作,直到告诉集群可以恢复平衡操作为止,禁用配置方式: 注意:put操作的时候,如果不是在集群节点上,需要加上完成的路径,如: 3.关掉需要维护的 阅读全文
posted @ 2018-09-20 21:58 天~宇~翱~翔 阅读(1496) 评论(0) 推荐(0) 编辑
摘要:基于 elasticsearch 1.4.4 版本.安装方式为RPM安装.所有涉及路径需根据实际情况来设置判断. 0x01 内存调整 调整ES内存分配有多种方式,建议调整 /etc/sysconfig/elasticsearch 中的设置(还可以直接修改bin下的启动脚本). 注:只需要修改 ES_ 阅读全文
posted @ 2018-09-20 21:52 天~宇~翱~翔 阅读(553) 评论(0) 推荐(0) 编辑
摘要:转自: https://mp.weixin.qq.com/s/wmSTyIGCVhItVNPHcH7nsA 一、整体架构 为什么采用ES作为搜索引擎呢?在做任何事情的时候,不要一上来就急着了解怎么做这件事情,而是去想想这件事情为什么值得去做。 这个是比较通用的数据的流程,一般会通过Kafka分离产生 阅读全文
posted @ 2018-09-20 21:31 天~宇~翱~翔 阅读(406) 评论(0) 推荐(0) 编辑
摘要:ElasticSearch集群的高可用和自平衡方案会在节点挂掉(重启)后自动在别的结点上复制该结点的分片,这将导致了大量的IO和网络开销。如果离开的节点重新加入集群,elasticsearch为了对数据分片(shard)进行再平衡,会为重新加入的节点再次分配数据分片(Shard), 当一台es因为压 阅读全文
posted @ 2018-09-20 20:43 天~宇~翱~翔 阅读(611) 评论(0) 推荐(0) 编辑
摘要:ES各种节点的分工 1. 客户端节点 当主节点和数据节点配置都设置为false的时候,该节点只能处理路由请求,处理搜索,分发索引操作等,从本质上来说该客户节点表现为智能负载平衡器。独立的客户端节点在一个比较大的集群中是非常有用的,他协调主节点和数据节点,客户端节点加入集群可以得到集群的状态,根据集群 阅读全文
posted @ 2018-09-06 15:11 天~宇~翱~翔 阅读(23623) 评论(3) 推荐(2) 编辑
摘要:分片未分配的原因主要有: 1)INDEX_CREATED:由于创建索引的API导致未分配。2)CLUSTER_RECOVERED :由于完全集群恢复导致未分配。3)INDEX_REOPENED :由于打开open或关闭close一个索引导致未分配。4)DANGLING_INDEX_IMPORTED 阅读全文
posted @ 2018-07-12 22:07 天~宇~翱~翔 阅读(3329) 评论(0) 推荐(0) 编辑
摘要:概要 含义如下: 搜索速率:对于单个索引,它是每秒查找次数*分片数。对于多个索引,它是每个索引的搜索速率的总和。 搜索延迟:每个分片中的平均延迟。 索引速率:对于单个索引,它是每秒索引的数量*分片数量。对于多个索引,它是每个索引的索引速率的总和。 索引延迟:每个分片中的平均延迟。 第一个是“搜索率” 阅读全文
posted @ 2018-07-12 21:35 天~宇~翱~翔 阅读(472) 评论(0) 推荐(0) 编辑
摘要:1. 实现查询去重、分页,例如:实现依据qid去重,createTime排序,命令行为: JAVA API 2. 取得某个索引中某个字段中的所有出现过的值 这种操作类似于使用SQL的SELECT UNIQUE语句。当需要获取某个字段上的所有可用值时,可以使用terms聚合查询完成:eg: selec 阅读全文
posted @ 2018-07-08 17:29 天~宇~翱~翔 阅读(17655) 评论(0) 推荐(0) 编辑
摘要:1. 分词的时机 对于ES来讲,可以对文档的内容进行分词(前提是设置了analyzed),也可以对输入的搜索词进行分词。对输入的搜索词进行分词时需要看下使用的什么类型的query。不同的query可能会对词进行分词,也可能不分词。无论是文档分词还是搜索词分词,依赖于使用的是什么分词器。分词的结果和分 阅读全文
posted @ 2018-05-12 22:51 天~宇~翱~翔 阅读(1274) 评论(0) 推荐(0) 编辑
摘要:SearchRequestBuilder常用方法说明 (1) setIndices(String... indices):上文中描述过,参数可为一个或多个字符串,表示要进行检索的index; (2) setTypes(String... types):参数可为一个或多个字符串,表示要进行检索的typ 阅读全文
posted @ 2018-05-12 22:25 天~宇~翱~翔 阅读(21225) 评论(0) 推荐(0) 编辑
摘要:2. zip包安装 2.1 https://github.com/mobz/elasticsearch-head下载zip 解压 2.2 建立elasticsearch-2.3.1\plugins\head文件 2.3 将解压后的elasticsearch-head-master文件夹下的文件cop 阅读全文
posted @ 2018-05-12 15:20 天~宇~翱~翔 阅读(276) 评论(0) 推荐(0) 编辑
摘要:2. 使用QueryBuilder 进行查询 使用QueryBuilder 2.1 termQuery("key", obj) 完全匹配 2.1 termsQuery("key", obj1, obj2..) 一次匹配多个值 2.3 matchQuery("key", Obj) 单个匹配, fiel 阅读全文
posted @ 2018-04-13 16:36 天~宇~翱~翔 阅读(298) 评论(0) 推荐(0) 编辑
摘要:1. 召回率和精准度 比如你搜索一个java spark,总共有100个doc,能返回多少个doc作为结果,就是召回率,recall 精准度,比如你搜索一个java spark,能不能尽可能让包含java spark,或者是java和spark离的很近的doc,排在最前面,precision 直接用 阅读全文
posted @ 2017-07-03 10:26 天~宇~翱~翔 阅读(1767) 评论(0) 推荐(1) 编辑
摘要:1. 近似匹配 什么是近似匹配,两个句子 java is my favourite programming language, and I also think spark is a very good big data system.java spark are very related, bec 阅读全文
posted @ 2017-07-03 09:23 天~宇~翱~翔 阅读(635) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示