elasticsearch(es)根据指定字段去重查询
distinctFieldName 就是去重字段,这个字段必须是keyword类型 不然会报错
//指定去重字段 CollapseBuilder collapseBuilder = new CollapseBuilder(distinctFieldName); // 查询去重后的结果数量 CardinalityAggregationBuilder aggregationBuilder = AggregationBuilders.cardinality("distinct").field(distinctFieldName); sourceBuilder.collapse(collapseBuilder); sourceBuilder.aggregation(aggregationBuilder);
//去重查询要取另外的总数量 ParsedCardinality distinct = search.getAggregations().get("distinct"); Long total = NumberUtil.parseLong(distinct.getValueAsString());
{ "query": { "match_all":{} }, "collapse": { "field": "ip" }, "from": 0, "size": 10, "track_total_hits": true, "aggs": { "courseAgg": { "cardinality": { "field": "ip" } } } }
根据ip去重
"track_total_hits":true 的作用 #获取超过1w条数据
2. 取得某个索引中某个字段中的所有出现过的值
这种操作类似于使用SQL的SELECT UNIQUE语句。当需要获取某个字段上的所有可用值时,可以使用terms聚合查询完成:eg: select distinct street_name from table_name ;
GET /index_streets/_search?size=0 { "aggs": { "street_values": { "terms": { "field": "name", "size": } } } }
因为目标是得到name字段上的所有出现过的值,因此size被设置为了0,这样在返回的响应中不会出现冗长的hits部分
3. 取得某个索引/类型下某个字段中出现的不同值的个数
这种操作类似于使用SQL的select count( * ) from (select distinct * from table)语句。当需要获取某个字段上的出现的不同值的个数时,可以使用cardinality聚合查询完成:
GET /index_streets/_search?size=0 { "aggs": { "uniq_streets": { "cardinality": { "field": "name.raw" } } } }
因为目标是得到name字段上的所有出现过的值,因此size被设置为了0,这样在返回的响应中不会出现冗长的hits部分
SpringBoot 整合es(elasticsearch)使用elasticsearch-rest-high-level-client实现增删改查参考:https://www.cnblogs.com/pxblog/p/14808454.html
-----------------------有任何问题可以在评论区评论,也可以私信我,我看到的话会进行回复,欢迎大家指教------------------------
(蓝奏云官网有些地址失效了,需要把请求地址lanzous改成lanzoux才可以)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· DeepSeek 开源周回顾「GitHub 热点速览」
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
2022-01-13 shell脚本重启进程(查找进程并杀掉,然后重启)
2022-01-13 centos设置crontab定时执行shell脚本