Elasticsearch官方文档翻译-相似度模块

本系列文章翻译ES官方8.0版本文档。本章对应内容地址 Similarity module

因为水平有限，翻译内容难免存在错漏，欢迎大家指出

相似度模块

　　相似度（评分或排序模型）指的是文档与查询条件的匹配度。相似度是字段级别的，也就是可以为mapping中的每个字段定义不同的相似度。

　　自定义相似度是一个高级功能，大多数时候内置的相似就可以满足需求，关于内置的相似度可参考similarity.

配置相似度

　　绝大多数自定义或现有的相似度模型都可以在索引上进行配置，如下

PUT /index
{
  "settings": {
    "index": {
      "similarity": {
        "my_similarity": {
          "type": "DFR",
          "basic_model": "g",
          "after_effect": "l",
          "normalization": "h2",
          "normalization.h2.c": "3.0"
        }
      }
    }
  }
}

上述设置，我们配置了一个DFR相似度模型，在定义mapping时可以使用 my_similarity指定该模型，如下

PUT /index/_mapping
{
  "properties" : {
    "title" : { "type" : "text", "similarity" : "my_similarity" }
  }
}

posted @ 2022-03-05 16:25 qqfde 阅读(261) 评论(0) 收藏举报

刷新页面返回顶部

qqfde

Elasticsearch官方文档翻译-相似度模块

公告