Python连接es笔记二之查询方式汇总

本文首发于公众号:Hunter后端
原文链接:Python连接es笔记二之查询方式汇总

上一节除了介绍使用 Python 连接 es,还有最简单的 query() 方法,这一节介绍一下几种其他的查询方式。

以下是本篇笔记目录:

  1. query() 方法介绍
  2. Q() 查询
  3. 排序
  4. 分页
  5. source() 指定返回字段
  6. extra() 操作
  7. count() 总数
  8. from_dict() 函数

1、query() 方法介绍

在上一节中介绍了 query() 的一个简单示例,如下:

s = Search(using="default").index("exam")

s = s.query("match", name="张三丰")

query() 中接受两个参数,第一个是字段查询的方式,比如这里是 match,也可以是 term,这个依照查询的目的来替换。

第二个则是查询的字段与值,比如这里是查询的 name 字段为 "张三丰" 的数据。

如果是有多个条件,比如 name="张三丰",address="中国" 的数据,这里的 = ,并非是完全等于的意思,而是会依照前面的查询方式,比如 match 或 term 进行类似的分词或者模糊搜索。

如果是上面多个条件的查询,可以直接在后面加上类似的 query():

s = s.query("match", name="张三丰").query("match", address="中国")

这两个 query() 通过链式操作连在一起转换成 es 语句就是使用 must 将多条件连接在一起,我们可以使用 to_dict() 方式来查看:

s.to_dict()

# {'query': {'bool': {'must': [{'match': {'name': '张三丰'}}, {'match': {'address': '中国'}}]}}}

2、Q() 查询

如果看过之前我写过的 Django 系列笔记,应该记得在 Django 里也有个 Q() 方法的查询,和这里的一样,也是用于条件的联合,与或非条件都可以实现。

引入方式如下:

from elasticsearch_dsl import Q

但是如果是在 Django 中使用 es 的连接,也是同样使用 Q() 方法,我们可以使用 as 来区分,这里我们对于 es 的 Q() 方法可以使用 ES_Q() 来区分:

from elasticsearch_dsl import Q as ES_Q

单个条件的使用 Q() 如下:

s = s.query(ES_Q("match", name="张三丰"))

如下使用 dict 形式的操作也是等效的:

s = s.query(ES_Q({"match": {"name": "张三丰"}}))

与操作

对于这两个条件,如果想要实现它们的与操作:

q1 = ES_Q("match", name="张三丰")
q2 = ES_Q("match", address="中国")

可以如下实现:

s = s.query(q1 & q2)

或操作

如果是想实现上面的或操作,可以如下:

s = s.query(q1 | q2)

非操作

如果是想取反,直接在条件前加一个 ~ 即可:

q1 = ~ES_Q("match", name="张三丰")
s = s.query(q1)

multi_match

如果是搜索多字段,可以如下操作:

q = ES_Q("multi_match", query="中国 张三丰", fields=["name", "address"])

s = s.query(q)

text.keyword 操作

对于 es 中 text 字段,前面我们介绍过 .keyword 的查询方式,是将 text 字段作为一个整体进行查询,在 ES_Q() 中,以下两种操作是等效的:

q = ES_Q({"term": {"address.keyword": "中国湖北省"}})

q = ES_Q("term", address__keyword="中国湖北省")

filter() 操作

在 es 中的 filter 操作,在 Python 中是一个 filter() 函数,可以直接使用:

q = ES_Q("term", name="张三丰")
s = s.filter(q)

range 操作

实现大小于的操作示例如下:

q = ES_Q({"range": {"age": {"gte": 21}}})
s = s.query(q)

exclude() 操作

如果是想取反,除了使用 ~Q(),还可以直接使用 exclude() 函数,这个和 Django 里的操作也是一样的:

q = ES_Q("term", name="张三丰")
s = s.exclude(q)

3、排序

如果是想对返回的结果进行排序操作,直接使用 .sort() 方法。

比如想对 age 字段排序,正序返回数据,可如下操作:

s = s.sort("age")

如果是想倒序返回,可以如下操作:

s = s.sort("-age")

多字段排序直接在后面跟上就行:

s = s.sort("-age", "name")

4、分页

Python 连接 es 进行分页,可以直接使用 Python 里的切片操作,比如:

s = s[5:10]

5、source() 指定返回字段

我们可以通过 source() 方法指定返回的字段:

s = s.source(["name", "address"])

source() 方法还可以接受 includes 和 excludes 参数来指定返回的字段或者不返回的字段,这个和 es 的原生处理方式是一致的:

s = s.source(
    includes=["address"],
    excludes=["name"]
)

6、extra() 操作

extra() 函数接受一些查询的额外属性,比如 size 参数决定返回条数,比如 from 参数可以决定从第几条数据开始返回,sort 参数决定排序方式,以及 _source 参数决定返回的字段。

比如我们想要返回的数据从第 2 条数据开始,返回两条,按照 name 字段进行排序,只返回 name 和 _id 字段,可以如下操作:

s = Search(using="default").index("exam")
s = s.extra(
    sort="name",
    _source=["name"],
    **{
        "from": 1,
        "size": 2
    }
)
response = s.execute()

7、count() 总数

前面介绍过获取符合条件的总数,可以通过 response.hits.total.value 的方式获得,其实对于 Search(),可以直接使用 count() 函数:

count = s.count()

8、from_dict() 函数

如果我们想直接运行 kibana 里执行的命令,可以使用 from_dict() 函数,比如:

s = s.from_dict(
  {
    "query": {
      "term": {
        "name": {
          "value": "张三丰"
        }
      }
    }
  }
)

如果想获取更多后端相关文章,可扫码关注阅读:
image

posted @ 2023-05-29 21:22  XHunter  阅读(319)  评论(0编辑  收藏  举报