Elasticsearch Span Query跨度查询
ES基于Lucene开发,因此也继承了Lucene的一些多样化的查询,比如本篇说的Span Query跨度查询,就是基于Lucene中的SpanTermQuery以及其他的Query封装出的DSL,接下来就看一下这些DSL都如何使用吧!
更多翻译参考:Elasticsearch知识汇总
span_term查询
这个查询如果单独使用,效果跟term查询差不多,但是一般还是用于其他的span查询的子查询。
用法也很简单,只需要指定查询的字段即可:
{ "span_term" : { "user" : "kimchy" } }
另外,还可以指定查询出的分值倍数:
{ "span_term" : { "user" : { "value" : "kimchy", "boost" : 2.0 } } }
span_multi查询
span_multi可以包装一个multi_term查询,比如wildcard,fuzzy,prefix,term,range或者regexp等等,把他们包装起来当做一个span查询。
用法也比较简单,内部嵌套一个普通的multi_term查询就行了:
{ "span_multi":{ "match":{ "prefix" : { "user" : { "value" : "ki" } } } } }
也可以使用boost乘以分值,以改变查询结果的分数:
{ "span_multi":{ "match":{ "prefix" : { "user" : { "value" : "ki", "boost" : 1.08 } } } } }
span_first查询
这个查询用于确定一个单词相对于起始位置的偏移位置,举个例子:
如果一个文档字段的内容是:“hello,my name is tom”,我们要检索tom,那么它的span_first最小应该是5,否则就查找不到。
使用的时候,只是比span_term多了一个end界定而已:
{ "span_first" : { "match" : { "span_term" : { "user" : "kimchy" } }, "end" : 3 } }
span_near查询
这个查询主要用于确定几个span_term之间的距离,通常用于检索某些相邻的单词,避免在全局跨字段检索而干扰最终的结果。
查询主要由两部分组成,一部分是嵌套的子span查询,另一部分就是他们之间的最大的跨度
{ "span_near" : { "clauses" : [ { "span_term" : { "field" : "value1" } }, { "span_term" : { "field" : "value2" } }, { "span_term" : { "field" : "value3" } } ], "slop" : 12, "in_order" : false, "collect_payloads" : false } }
上面的例子中,value1,value2,value3最长的跨度不能超过12.
span_or查询
这个查询会嵌套一些子查询,子查询之间的逻辑关系为 或
{ "span_or" : { "clauses" : [ { "span_term" : { "field" : "value1" } }, { "span_term" : { "field" : "value2" } }, { "span_term" : { "field" : "value3" } } ] } }
span_not查询
这个查询相对于span_or来说,就是排除的意思。不过它内部有几个属性,include用于定义包含的span查询;exclude用于定义排除的span查询
{ "span_not" : { "include" : { "span_term" : { "field1" : "hoya" } }, "exclude" : { "span_near" : { "clauses" : [ { "span_term" : { "field1" : "la" } }, { "span_term" : { "field1" : "hoya" } } ], "slop" : 0, "in_order" : true } } } }
span_containing查询
这个查询内部会有多个子查询,但是会设定某个子查询优先级更高,作用更大,通过关键字little和big来指定。
{ "span_containing" : { "little" : { "span_term" : { "field1" : "foo" } }, "big" : { "span_near" : { "clauses" : [ { "span_term" : { "field1" : "bar" } }, { "span_term" : { "field1" : "baz" } } ], "slop" : 5, "in_order" : true } } } }
span_within查询
这个查询与span_containing查询作用差不多,不过span_containing是基于lucene中的SpanContainingQuery,而span_within则是基于SpanWithinQuery。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?
2014-11-20 【插件开发】—— 13 GEF双击模型事件