随笔分类 - ES
摘要:《读书报告 – Elasticsearch入门 》第一章 Elasticsearch入门Elasticsearch是一个实时的分布式搜索和分析引擎,使得人们可以在一定规模上和一定速度上实现数据检索,常用于全文本检索,结构化检索、分析以及三种的结合应用。Wikipedia、Guardi...
阅读全文
摘要:《读书报告 – Elasticsearch入门 》'第四章 分布式文件存储这章的主要内容是理解数据如何在分布式系统中存储。4.1 路由文档到分片创建一个新文档时,它是如何确定应该存储在分片1还是分片2上的呢?这个过程不是随机的,因为将来要检索文档。事实上,它根据一个简单的算法决定:s...
阅读全文
摘要:第十三章 全文检索这一章开始介绍 全文检索 :怎样对全文字段(full-text fields)进行检索以找到相关度最高的文档。全文检索最重要的两个方面是:相关度(Relevance)根据文档与查询的相关程度对结果集进行排序的能力。相关度可以使用TF/IDF、地理位置相近程度、模糊相...
阅读全文
摘要:Part II 深入搜索搜索不仅仅是全文本搜索:数据的很大部分是结构化的值例如日期、数字。这部分开始解释怎样以一种高效地方式结合结构化搜索和全文本搜索。第十二章 结构化搜索结构化搜索_ 是指查询包含内部结构的数据。日期,时间,和数字都是结构化的:它们有明确的格式给你执行逻辑操作...
阅读全文