摘要: 对于一个数据存储系统来说,如何保证数据可靠性、提高读写吞吐量是重中之重。 一、文档分布式存储的流程 我们知道 ES 的索引有一个或者多个分片,而分片又分为主分片和副本分片两种。 那数据写入索引的过程是怎么样的呢?数据写入主分片和副分片的流程又是怎样的呢? 文档分布式存储首先需要找到能存储文档的主分片 阅读全文
posted @ 2023-02-16 11:59 Dazzling! 阅读(1183) 评论(0) 推荐(0) 编辑
摘要: 如上图,这个倒排索引使用哈希表来实现也是可以的,其有着 O(1) 查询复杂度,能完美地满足我们的需求。但是呢,现实中数据往往是海量的,如果简单地使用哈希表来实现倒排索引是不可行的,因为存储海量的数据时,系统将会面临下面几个问题: 分词形成的词项(term)可能是海量的,需要可以在内存和磁盘上高效存储 阅读全文
posted @ 2023-02-16 10:50 Dazzling! 阅读(212) 评论(0) 推荐(0) 编辑