查询并删除Elasticsearch库中指定字段重复的数据

比如我要查询Elasticsearch库中字段为:id的有没有重复数据,可以用下面的方法,先查询出来,再执行删除。

复制代码
$from = 0;
$size = 0;
$url = 'http://127.0.0.1/aaaaaa/_search';
$data['from'] = $from;
$data['size'] = $size;
$data['aggs']['my']['terms'] = ['field'=>'id'];

$post_data = json_encode($data,JSON_UNESCAPED_UNICODE);
$relust = curl_post($url,$post_data);
$relust = json_decode($relust,true);
if(!empty($relust['aggregations']['my']['buckets'])){
    foreach ($relust['aggregations']['my']['buckets'] as $k=>$v)
    {
        $doc_id = $v['key'];
        $url = 'http://127.0.0.1/aaaaaa/_delete_by_query';
        $data = [
            'query'=>['bool'=>['must'=>[['term'=>['id'=>$id]]]]]
        ];
        $data['query']['bool']['filter'][0]['bool']['must']['match_phrase']['id'] = $id;
        $post_data = json_encode($data);
        $relust = curl_post($url,$post_data);
    }
}
return json(['code'=>10000,'msg'=>'删除成功']);
复制代码

 

 

 
posted @   赵瑛  阅读(512)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
· 推荐几款开源且免费的 .NET MAUI 组件库
· 实操Deepseek接入个人知识库
· 易语言 —— 开山篇
· Trae初体验
历史上的今天:
2022-02-23 centos 指定ip进行ssh连接
2022-02-23 centos 设置远程连接超时断开
2022-02-23 SQL查询一个表中另外一个表不存在的数据
2022-02-23 激活windows2012的方法

版权所有 © 2022 沅来是澧

如果有程序开发、网站建设等需求的请联系我,QQ:47419233

点击右上角即可分享
微信分享提示