随笔分类 - ElasticSearch
摘要:1、了解倒排索引的基本概念 1.1、倒排索引是什么 倒排索引是一种用于全文搜索的数据结构,它将文档中的每个单词映射到包含该单词的所有文档的列表中,然后用该列表替换单词。因此,倒排索引在文本搜索和信息检索中广泛应用,如搜索引擎、网站搜索、文本分类等场景中。 具体来说,一个倒排索引包含一个词语词典和每个
阅读全文
摘要:match 和 term 查询是两种常用的查询方式,在用途和行为上有着显著的差异: 1. match 查询【实际底层就是多个term查询的结果给汇合在一起】全文搜索:match 查询用于全文搜索场景。它在查询之前对字段值和查询字符串进行分词(tokenization)处理。 分析器(Analyzer
阅读全文
摘要:什么是相关性 相关度是指两个事物间相互关联的程度,在检索领域特指检索请求与检索结果之间的相关程度。默认情况下,返回结果是按相关性倒序排列的。 但什么是相关性? 相关性如何计算? 每个文档都有相关性评分,用一个正浮点数字段 _score 来表示 。 _score 的评分越高,相关性越高。 查询语句会为
阅读全文
摘要:ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可
阅读全文
摘要:了解向量搜索 向量搜索代表了搜索技术的飞跃,它利用机器学习和人工智能的力量来理解单词和文档之间的语义关系。向量搜索不仅仅依赖于关键字匹配,而是创建文档和查询的数学表示,使其能够理解不同信息的上下文、相关性和相似性。 为了掌握向量搜索的概念,将向量想象为多维空间中指向不同方向的箭头。 每个向量代表一个
阅读全文
摘要:1、ELK简介 ELK是一套针对日志数据做解决方案的框架,是三个开源软件的缩写,分别表示:Elasticsearch , Logstash, Kibana , 它们都是开源软件。新增了一个FileBeat,它是一个轻量级的日志收集处理工具(Agent),Filebeat占用资源少,适合于在各个服务器
阅读全文