上一页 1 2 3 4 5 6 7 8 9 ··· 14 下一页
摘要: ElasticSearch 2 (21) 语言处理系列之单词识别 摘要 一个英语单词相对容易识别:因为英语单词是被空格或(某些)标点符号隔开的。但在英语中也有反例: you’re 这个词是一个单词还是两个?那 o’clock 、 cooperate 、 half baked 或 eyewitness 阅读全文
posted @ 2016-03-16 10:26 Richaaaard 阅读(1877) 评论(0) 推荐(1) 编辑
摘要: ElasticSearch 2 (20) 语言处理系列之如何开始 摘要 Elasticsearch 配备了一组语言分析器,为世界上大多数常见的语言提供良好的现成基础支持。 阿拉伯语、亚美尼亚语,巴斯克语,加泰罗尼亚语,巴西语、保加利亚语、汉语、捷克语、丹麦语、荷兰语、英语、芬兰语、法语、德语、希腊语 阅读全文
posted @ 2016-03-16 10:17 Richaaaard 阅读(1069) 评论(0) 推荐(0) 编辑
摘要: ElasticSearch 2 (19) 语言处理系列之故事开始 摘要 全文搜索是精度(尽可能少的返回不相关文档)和召回(尽可能多的返回相关文档)的战场。尽管只精确匹配用户查询的词肯定会是精确的,但这并不够。我们可能会丢失许多被用户认为相关的文档,取而代之的是我们需要扩大撒网范围,去搜索那些与原始查 阅读全文
posted @ 2016-03-16 09:37 Richaaaard 阅读(621) 评论(0) 推荐(0) 编辑
摘要: ElasticSearch 2 (18) 深入搜索系列之控制相关度 摘要 处理结构化数据(比如:时间、数字、字符串、枚举)的数据库只需要检查一个文档(或行,在关系数据库)是否与查询匹配。 布尔是/非匹配是全文搜索的基础部分,但不止这些,我们也同样需要知道每个文档与查询的相关度,在全文搜索引擎中我们不 阅读全文
posted @ 2016-03-08 17:54 Richaaaard 阅读(6383) 评论(1) 推荐(0) 编辑
摘要: ElasticSearch 2 (17) 深入搜索系列之部分匹配 摘要 到目前为止,我们介绍的所有查询都是基于完整术语的,为了匹配,最小的单元为单个术语,我们只能查找反向索引中存在的术语。 但是,如果我们想匹配部分术语而不是全部改怎么办? 部分匹配(Partial matching) 允许用户指定查 阅读全文
posted @ 2016-03-08 15:37 Richaaaard 阅读(6346) 评论(1) 推荐(0) 编辑
摘要: ElasticSearch 2 (16) 深入搜索系列之近似度匹配 摘要 标准的全文搜索使用TF/IDF处理文档、文档里的每个字段或一袋子词。 match 查询可以告诉我们哪个袋子里面包含我们搜索的术语,但这只是故事的一部分。它并不能告诉我们词语之间的关系。 考虑下面句子的区别: Sue ate t 阅读全文
posted @ 2016-03-08 09:20 Richaaaard 阅读(9522) 评论(0) 推荐(1) 编辑
摘要: ElasticSearch 2 (15) 深入搜索系列之多字段搜索 摘要 查询很少是简单的一句话匹配(one clause match )查询。很多时候,我们需要用相同或不同的字符串查询1个或多个字段,也就是说,我们需要对多个查询语句以及他们相关分数(relevance scores)进行有意义的合 阅读全文
posted @ 2016-03-07 15:38 Richaaaard 阅读(5159) 评论(0) 推荐(2) 编辑
摘要: ElasticSearch 2 (14) 深入搜索系列之全文搜索 摘要 在看过结构化搜索之后,我们看看怎样在全文字段中查找相关度最高的文档。 全文搜索两个最重要的方面是: 相关(relevance) 相关是将查询到相关的文档结果进行排名的一种能力,这种相关度可以是根据TF/IDF、地理位置相似性(g 阅读全文
posted @ 2016-03-04 18:34 Richaaaard 阅读(5551) 评论(0) 推荐(0) 编辑
摘要: ElasticSearch 2 (13) 深入搜索系列之结构化搜索 摘要 结构化查询指的是查询那些具有内在结构的数据,比如日期、时间、数字都是结构化的。它们都有精确的格式,我们可以对这些数据进行逻辑操作,比较常见的操作包括比较时间区间,或者获取两个数字间的较大值。 文本也可以是结构化的。比如彩笔可以 阅读全文
posted @ 2016-03-04 11:32 Richaaaard 阅读(3831) 评论(2) 推荐(1) 编辑
摘要: ElasticSearch 2 (12) Shard数调优(ElasticSearch性能) 摘要 当创建一个索引的时候,我们经常会面对一个问题:要为索引分配多少个shard?多少个replica?对于这个问题,仍然没有明确的统一答案,但是本文会给出一些引导,方便在实施ElasticSearch时给 阅读全文
posted @ 2016-03-01 18:28 Richaaaard 阅读(16861) 评论(3) 推荐(1) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 14 下一页