上一页 1 2 3 4 5 6 7 8 ··· 14 下一页
摘要: ElasticSearch 2 (31) 信息聚合系列之时间处理 摘要 如果说搜索是 Elasticsearch 里最受欢迎的功能,那么按时间创建直方图一定排在第二位。为什么需要使用时间直方图? 版本 elasticsearch版本: elasticsearch 2.x 内容 如果说搜索是 Elas 阅读全文
posted @ 2016-03-24 11:14 Richaaaard 阅读(6190) 评论(0) 推荐(0) 编辑
摘要: ElasticSearch 2 (30) 信息聚合系列之条形图 摘要 版本 elasticsearch版本: elasticsearch 2.x 内容 聚合还有一个令人激动的特性就是能够十分容易地将它们转换成图表和图形。本章中,我们会关注于各种各样的分析并反复“蹂躏”我们示例中的数据。我们也会展现聚 阅读全文
posted @ 2016-03-24 09:10 Richaaaard 阅读(610) 评论(0) 推荐(0) 编辑
摘要: ElasticSearch 2 (29) 信息聚合系列之测试驱动 摘要 我们可以用以下几页定义不同的聚合和它们的语法,但学习聚合的最佳途径就是用实例来说明。一旦我们获得了聚合的思想,以及如何合理地嵌套使用它们,那么语法就变得不那么重要。 版本 elasticsearch版本: elasticsear 阅读全文
posted @ 2016-03-23 18:28 Richaaaard 阅读(565) 评论(0) 推荐(0) 编辑
摘要: ElasticSearch 2 (28) 信息聚合系列之高层概念 摘要 和查询表达式(query DSL)一样,聚合也有一种可编辑的语法:可以根据我们的需要混合以及匹配使用独立的功能单元。这也就是说我们只要学习很少的基本概念,就能将它们进行无限组合,从而实现不同的功能。 要掌握聚合,只需要理解下面两 阅读全文
posted @ 2016-03-23 17:03 Richaaaard 阅读(556) 评论(0) 推荐(0) 编辑
摘要: ElasticSearch 2 (27) 信息聚合系列之故事开始 摘要 到目前为止,本书都在着重介绍搜索。对于搜索,我们有查询条件以及与查找到与条件匹配的集合。这个过程就和如大海捞针一样。 对于聚合,我们站在远处总观数据。与查看单个文档不同,我们想要对数据集合进行整体的分析和总结。 版本 elast 阅读全文
posted @ 2016-03-23 16:00 Richaaaard 阅读(553) 评论(0) 推荐(0) 编辑
摘要: ElasticSearch 2 (26) 语言处理系列之打字或拼写错误 摘要 我们喜欢在对结构化数据(如:日期和价格)做查询时,结果只返回那些能精确匹配的文档。但是,好的全文搜索不应该有这样的限制。相反,我们可以扩大范围,包括更多可能匹配的词语,使用相关度评分将更匹配的文档放置在结果集的顶部。 事实 阅读全文
posted @ 2016-03-16 11:03 Richaaaard 阅读(1531) 评论(0) 推荐(1) 编辑
摘要: ElasticSearch 2 (25) 语言处理系列之同义词 摘要 词干提取有助于通过简化屈折词到它们词根的形式来扩展搜索的范围,而同义词是通过关联概念和想法来扩展搜索范围的。或许没有文档能与查询 “English queen” 相匹配,但是包含 “British monarch” 的文档会很可能 阅读全文
posted @ 2016-03-16 10:57 Richaaaard 阅读(2011) 评论(0) 推荐(0) 编辑
摘要: ElasticSearch 2 (24) 语言处理系列之停用词:性能与精度 摘要 在信息检索早期,磁盘和内存相较我们今天的使用只是很小的一部分。将索引空间保持在一个较小的水平是至关重要的,节省每个字节都意味着巨大的性能提升。词干提取(参见 缩减单词至词根形式(Reducing Words to Th 阅读全文
posted @ 2016-03-16 10:51 Richaaaard 阅读(1440) 评论(0) 推荐(0) 编辑
摘要: ElasticSearch 2 (23) 语言处理系列之词根提取 摘要 世界上大多数语言都是屈折变化的,意思是词语可以通过变形来表达不同的含义: 数(Number): fox, foxes 时态(Tense): pay, paid, paying 性(Gender): waiter, waitres 阅读全文
posted @ 2016-03-16 10:47 Richaaaard 阅读(1789) 评论(0) 推荐(0) 编辑
摘要: ElasticSearch 2 (22) 语言处理系列之标记规范化 摘要 将文本拆解成标记只是工作的一半。为了使这些标记更容易被搜索到,它们需要经过一个规范化的处理过程,以移除相同单词间不重要的差异(比如:大小写)。或许我们还需要移除一些重要的差异,让 、`ésta está déjà vu dej 阅读全文
posted @ 2016-03-16 10:37 Richaaaard 阅读(1044) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 14 下一页