上一页 1 2 3 4 5 6 7 8 ··· 14 下一页
摘要: 一、基于查询结果的聚合 1、基于query的aggs 1 #价格大于4500的标签进行聚合 2 GET product/_search 3 { 4 "size": 10, 5 "query": { 6 "range": { 7 "price": { 8 "gte": 4500 9 } 10 } 11 阅读全文
posted @ 2022-02-11 18:17 showMeTheCodes 阅读(78) 评论(0) 推荐(0) 编辑
摘要: 一、分桶聚合 1、分桶聚合:根据属性进行分桶,把具有某些相同属性的数据放到一起,相当于mysql的group by 举例:JD商城2021年手机销售量,如果采用分桶聚合。可以按照:小米、华为、苹果、其他等品牌进行聚合 2、 1 #统计不同标签的商品数量 2 GET product/_search 3 阅读全文
posted @ 2022-02-11 16:04 showMeTheCodes 阅读(537) 评论(0) 推荐(0) 编辑
摘要: 一、自定义分词器 1 #自定义分词器 2 PUT cunstom_analysis 3 { 4 "settings": { 5 "analysis": { 6 "char_filter": { 7 "my_char_filter":{ 字符过滤器,在切词时将指定词语进行替换 8 "type":"ma 阅读全文
posted @ 2022-02-11 09:56 showMeTheCodes 阅读(225) 评论(0) 推荐(0) 编辑
摘要: 一、normalization normalization:规范化。在切词之后,包括大小写的转换、去掉语气词停用词(is、an)、单复数的变化 每种分词器的normalization策略不一样,如下图展示 二、char filter char filter:字符过滤器,在切词之前完成操作 1、HTM 阅读全文
posted @ 2022-02-11 07:43 showMeTheCodes 阅读(25) 评论(0) 推荐(0) 编辑
摘要: 一、元数据 1、从索引中查询出的结果可以称之为元数据,如下图 2、可以禁止元数据的展示(一般不使用) 使用如下代码查询后,元数据将不再展示 1 GET product/_search 2 { 3 "_source": false, 4 "query": { 5 "match_all": {} 6 } 阅读全文
posted @ 2022-02-10 16:16 showMeTheCodes 阅读(855) 评论(0) 推荐(0) 编辑
摘要: 一、概念 ES中的mapping类似于数据库中的表结构。mapping中包含字段名称、类型、字段使用的分词器、是否评分、是否创建索引等属性 二、查看mapping GET index/_mapping 三、常用数据类型 数字类型:long、integer、short、byte、double、floa 阅读全文
posted @ 2022-02-09 17:47 showMeTheCodes 阅读(385) 评论(0) 推荐(0) 编辑
摘要: C 1 #创建索引 2 PUT product 3 #插入数据 4 PUT product/_doc/1 5 { 6 "name": "lyc", 7 "age": 25 8 } R 1 #查询所有索引 2 GET _cat/indices?v 3 #查询指定索引的数据信息 4 GET produc 阅读全文
posted @ 2022-02-09 15:34 showMeTheCodes 阅读(33) 评论(0) 推荐(0) 编辑
摘要: 一、集群 1、每个节点就是一个ElasticSearch的实例(在linux中每执行一个es启动,就代表有一个节点启动) 2、集群健康值状态: green:所有主分片和副本分片都健康 yellow:至少有一个副本分片不可用,此时数据是完整的 red:至少有一个主分片不可用 3、健康值检查:_cat/ 阅读全文
posted @ 2022-02-09 14:53 showMeTheCodes 阅读(124) 评论(0) 推荐(0) 编辑
摘要: 一、前缀树原理 依次输入:msb、msn、msbtech、wltech会产生如上图数据结构 1、如果出现可以公用的元素,则另开分支将不可以公用的部分进行存储,最后一个节点标记为绿色 2、在查找时按照从头到尾的顺序进行查找,只有每个节点都符合并且最后一个字母为绿色final节点时代表查询成功 3、若没 阅读全文
posted @ 2022-02-09 08:25 showMeTheCodes 阅读(719) 评论(0) 推荐(0) 编辑
摘要: 一、为什么有了FOR压缩算法后还要使用RBM压缩算法 FOR压缩算法适用于间隔比较小的倒排表id,如1,2,3,5,8.......。间隔较小的数字在进行间隔相减的时候得出的结果也会比较小,这时在使用FOR压缩算法的时候能有效控制存储空间。 但是,假如遇到间隔较大的倒排表id,如1000,62101 阅读全文
posted @ 2022-02-08 18:57 showMeTheCodes 阅读(244) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 14 下一页