摘要: 没有多余的废话,直接上方案吧! 方案一: 最笨的方案即:for * for,对应的时间复杂度为:O(n*n) 每个搜索词命中的网页是非常多的,O(n*n) 的复杂度是明显不能接受的。倒排索引是在创建之初可以进行排序预处理,问题转化成两个有序的list求交集,就方便多了。 画外音:比较笨的方法。 方案 阅读全文
posted @ 2020-06-24 17:35 星火燎原智勇 阅读(1358) 评论(1) 推荐(0) 编辑
摘要: 1、为什么需要倒排索引 倒排索引,也是索引。 索引,初衷都是为了快速检索到你要的数据。 每种数据库都有自己要解决的问题(或者说擅长的领域),对应的就有自己的数据结构,而不同的使用场景和数据结构,需要用不同的索引,才能起到最大化加快查询的目的。 对 Mysql 来说,是 B+ 树,对 Elastics 阅读全文
posted @ 2020-06-24 11:40 星火燎原智勇 阅读(1845) 评论(0) 推荐(0) 编辑
摘要: CAP C(Consistency):强一致性 A(Availability):可用性 P(Parition tolerance):分区容错性 这三个基本需求,最多只能同时满足其中的两项,在分布式环境下因为P是必须的,因此往往选择就在 CP 或者 AP 中。 各种组合的场景 CA - 这个比较特殊, 阅读全文
posted @ 2020-06-24 11:04 星火燎原智勇 阅读(796) 评论(0) 推荐(0) 编辑