摘要: 一、背景 1.ES默认分页from+size 2.在大数据量和深度分页的时候,效率非常低 二、效率低原因 1.例如要查第501页的10条数据,from为5000,size为10 2.ES会查询并排序5010条数据,即处理了from+size条数据 3.ES为了性能,限制了分页数量,最大为1万,max 阅读全文
posted @ 2022-03-28 14:03 牧云文仔 阅读(345) 评论(0) 推荐(0) 编辑
摘要: 一、bool查询包含四种操作 1.must 2.must not 3.filter 4.should 二、功能 1.must 对应mysql的 and a= 2.must not 对应mysql的 and a!= 3.filter 对应mysql的 and a= 4.should 对应mysql的 阅读全文
posted @ 2022-03-28 11:36 牧云文仔 阅读(804) 评论(0) 推荐(0) 编辑
摘要: 一、概念 1.ES主要用于搜索 2.搜索要把更有相关性的结果展示出来 3.对一个文档评分,相关性越大,评分越高 4.打分的本质是排序 二、评分规则 1.ES5之前,默认评分规则是TF-IDF,这是信息检索领域最重要的发明 a.TF(Term Frequency)词频,检索词在一篇文档中出现的频次,检 阅读全文
posted @ 2022-03-28 11:34 牧云文仔 阅读(441) 评论(0) 推荐(0) 编辑