ES查询之聚合函数、分组查询
1|0一、前言
-
聚合函数大家都不陌生,同数据库的聚合函数一样,elasticsearch中也没玩出新花样,所以,这一章相对简单,只需要记得下面几个用法即可:
-
avg
-
max
-
min
-
sum
-
-
聚合的两个主要的概念,分别是 桶 和 指标
-
桶类似就是一个组,在下面的示例中aggs中的起别名,一个别名就是一个桶
-
指标就是对桶内的文档进行统计计算,通常是简单的数学运算(像是min、max、avg、sum)
-
-
聚合操作用到了
aggs
关键字,叫做aggs
聚合的模板。- 当query和aggs一起存在时,会先执行query的主查询,主查询query执行完后会搜出一批结果,而这些结果才会被aggs拿去做聚合
- 另外要注意aggs后面会先接一层自定义的这个聚合的名字,然后才是接上要使用的聚合桶
- 如果有些情况不在意查询结果是什麽,而只在意aggs的结果,可以把size设为0,如此可以让返回的hits结果集是0,加快返回的速度
- 一个aggs裡可以有很多个聚合,每个聚合彼此间都是独立的。因此可以一个聚合拿来统计数量、一个聚合拿来分析数据、一个聚合拿来计算标准差...,让一次搜索就可以把想要做的事情一次做完
- aggs可以嵌套在其他的aggs裡面,而嵌套的aggs能作用的文档集范围,是其外层的桶所输出的结果集
2|0二、准备数据
3|0三、avg
- 现在的需求是查询
from
是gu
的人的平均年龄。
-
上例中,首先匹配查询
from
是gu
的数据。在此基础上做查询平均值的操作,这里就用到了聚合函数,其语法被封装在aggs
中,而my_avg
则是为查询结果起个别名(类似select avg(age) as my_avg
),封装了计算出的平均值。那么,要以什么属性作为条件呢?是age
年龄,查年龄的什么呢?是avg
,查平均年龄。 -
返回结果如下:
-
上例中,在查询结果的最后是平均值信息,可以看到是27岁。
-
虽然我们已经使用
_source
对字段做了过滤,但是还不够。我不想看都查到了哪些条数据,只想看统计的平均值怎么办?别忘了size
,size和from
只对hits内的结果条数有影响,聚合函数的结果不在size和from
的控制内
-
上例中,只需要在原来的查询基础上,增加一个
size
就可以了,输出几条结果,我们写上0,就是输出0条查询结果。 -
查询结果如下:
- 查询结果中,我们看
hits
下的total
值是3,说明有三条符合结果的数据。最后面返回平均值是27。
4|0四、max
- 那怎么查最大值呢?
-
上例中,只需要在查询条件中将
avg
替换成max
即可。 -
返回结果如下:
- 在返回的结果中,可以看到年龄最大的是30岁。
5|0五、min
- 那怎么查最小值呢?
-
最小值则用
min
表示。 -
返回结果如下:
- 返回结果中,年龄最小的是22岁。
6|0六、sum
- 那么,要是想知道他们的年龄总和是多少怎么办呢?
- 上例中,求和用
sum
表示。
- 从返回的结果可以发现,年龄总和是81岁。
7|0七、多个聚合和嵌套聚合
-
一个aggs裡可以有很多个聚合,每个聚合彼此间都是独立的,因此可以一个聚合拿来统计数量、一个聚合拿来分析数据、一个聚合拿来计算标准差...,让一次搜索就可以把想要做的事情一次做完
-
aggs可以嵌套在其他的aggs裡面,而嵌套的桶能作用的文档集范围,是外层的桶所输出的结果集
8|0七、分组查询
-
分组查询用到了关键字
range
-
现在我想要查询所有人的年龄段,并且按照
15~20,20~25,25~30
分组,并且算出每组的平均年龄。 -
分析需求,首先我们应该先把分组做出来。
- 上例中,在
aggs
的自定义别名age_group
中,使用range
来做分组,field
是以age
为分组,分组使用ranges
来做,from
和to
是范围,我们根据需求做出三组。
-
返回的结果中可以看到,已经拿到了三个分组。
doc_count
为该组内有几条数据,此次共分为三组,查询出1+1+2共4条内容。还有一条数据的age
属性值是30
,不在分组的范围内! -
那么接下来,我们就要对每个小组内的数据做平均年龄处理。
- 上例中,在分组下面,我们再使用一个
aggs
(相当于嵌套aggs
)对分组的age
做平均数处理,这样就可以了。
-
在结果中,我们可以清晰的看到每组的平均年龄(
my_avg
的value
中)。 -
注意:聚合函数的使用,一定是先查出结果,然后才再对结果进行聚合函数处理
__EOF__

本文链接:https://www.cnblogs.com/Mcoming/p/18123632.html
关于博主:评论和私信会在第一时间回复。或者直接私信我。
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
声援博主:如果您觉得文章对您有帮助,可以点击文章右下角【推荐】一下。您的鼓励是博主的最大动力!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南