2018年9月1日

ElasticSearch(六)底层索引控制

摘要: 相似度算法 涉及到了ES的底层,首先讲一下ES的底层核心,相似度模型,ES的查询和传统的数据库查询最大的差别就在相似度查询(之前讲过,索引存储的最大差别就是讲非结构化数据转化为结构化),ES里面会给文档的相似度打分。那么这种打分的算法就是ES的查询的核心,默认的算法是TF/IDF,除了这个默认的算法之外还有很多其他的算法,罗列一下,当你发现现在的查询速度以及效率不满足需要的时候,可以考虑一下下面的... 阅读全文

posted @ 2018-09-01 11:46 下士闻道 阅读(941) 评论(0) 推荐(0) 编辑

ElasticeSearch(五)分布式索引架构

摘要: 关于分布式架构 首先将ES默认每个索引是5个分片,这样做得目的是两个一个索引的时候速度更快(将数据写到小分片的尾部比写入大分片尾部更加快);另外一个是当数据量达到一定程度之后,分片查询,在汇总(scater-gathter)这种模式更加简单一些。 ES的分片奠定了ES在分布式存储的地位,也意味着ES 阅读全文

posted @ 2018-09-01 10:35 下士闻道 阅读(3494) 评论(0) 推荐(0) 编辑

导航