Elasticsearch官方文档翻译-相似度模块

本系列文章翻译ES官方8.0版本文档。本章对应内容地址  Similarity module

因为水平有限,翻译内容难免存在错漏,欢迎大家指出

点击跳转本系列目录

相似度模块

  相似度(评分或排序模型)指的是文档与查询条件的匹配度。相似度是字段级别的,也就是可以为mapping中的每个字段定义不同的相似度。

  自定义相似度是一个高级功能,大多数时候内置的相似就可以满足需求,关于内置的相似度可参考similarity.

配置相似度

  绝大多数自定义或现有的相似度模型都可以在索引上进行配置,如下

PUT /index
{
  "settings": {
    "index": {
      "similarity": {
        "my_similarity": {
          "type": "DFR",
          "basic_model": "g",
          "after_effect": "l",
          "normalization": "h2",
          "normalization.h2.c": "3.0"
        }
      }
    }
  }
}

上述设置,我们配置了一个DFR相似度模型,在定义mapping时可以使用 my_similarity指定该模型,如下

PUT /index/_mapping
{
  "properties" : {
    "title" : { "type" : "text", "similarity" : "my_similarity" }
  }
}

 

 

posted @ 2022-03-05 16:25  qqfde  阅读(210)  评论(0编辑  收藏  举报