hash索引和B+树索引的底层实现原理
Hash索引底层就是hash表,进行查找时,调用一次hash函数就可以获取到相应的键值,之后进行回表查询获得实际数据。B+树底层实现是多路平衡查找树,对于每一次的查询都是从根节点出发,查找到叶子节点方可获得所查键值,然后根据查询判断是否需要回表查询数据。
Hash索引和B+树索引区别如下:
- 一般情况下,Hash索引进行等值查询更快,但无法进行范围查询。
- 因为在hash索引中经过hash函数建立索引之后,索引的顺序与原顺序无法保持一致,不能支持范围查询。而B+树的所有节点皆遵循左节点小于父节点,右节点大于父节点,多叉树也类似,天然支持范围查询。
- Hash索引不支持使用索引进行排序。
- Hash索引不支持模糊查询以及多列索引的最左前缀匹配,原理是因为hash函数的不可预测性。AAAA和AAAAB的索引没有相关性。
- Hash索引任何时候都避免不了回表查询数据,而B+树在符合某些条件(聚簇索引,覆盖索引等)时可以值通过索引完成查询。
- Hash索引虽然在等值查询上比较快,但不稳定,性能不可预测,当某个键值存在大量重复的时候,发生hash碰撞,此时效率可能极差。而B+树的查询效率比较稳定,对于所有的查询都是从根节点到叶子节点,且树的高度较低。
大多情况下,直接选择B+树索引可以获得稳定且较好的查询速度,而不需要使用hash索引。
欢迎批评指正,提出问题,谢谢!