Elasticsearch官方文档翻译-相似度模块
因为水平有限,翻译内容难免存在错漏,欢迎大家指出
相似度模块
相似度(评分或排序模型)指的是文档与查询条件的匹配度。相似度是字段级别的,也就是可以为mapping中的每个字段定义不同的相似度。
自定义相似度是一个高级功能,大多数时候内置的相似就可以满足需求,关于内置的相似度可参考similarity
.
配置相似度
绝大多数自定义或现有的相似度模型都可以在索引上进行配置,如下
PUT /index { "settings": { "index": { "similarity": { "my_similarity": { "type": "DFR", "basic_model": "g", "after_effect": "l", "normalization": "h2", "normalization.h2.c": "3.0" } } } } }
上述设置,我们配置了一个DFR相似度模型,在定义mapping时可以使用 my_similarity指定该模型,如下
PUT /index/_mapping { "properties" : { "title" : { "type" : "text", "similarity" : "my_similarity" } } }