索引原理-btree索引与hash索引的区别

　　btree索引与hash索引的区别，之前不清楚，mark一下。

　　Hash索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以Hash索引的查询效率要远高于B-Tree索引。

　　可能很多人又有疑问了，既然Hash索引的效率要比B-Tree高很多，为什么大家都不用Hash索引而还要使用B-Tree索引呢？任何事物都是有两面性的，Hash索引也一样，虽然Hash索引效率高，但是Hash索引本身由于其特殊性也带来了很多限制和弊端，主要有以下这些：

　　1、Hash索引仅仅能够满足“=”，“IN”和“<=>”查询，不能使用范围查询。

　　由于Hash索引比较的是进行Hash运算之后的Hash值，所以它只能用于等值的过滤，不能用于基于范围的过滤，因为进过相应的Hash算法处理之后的Hash值的大小关系，并不能保证和Hash运算前完全一样。

　　2、Hash索引无法被用来避免数据的排序操作

　　　由于Hash索引中存放的是经过Hash计算之后的Hash值，而且Hash值的大小管理并不一定和Hash运算前的键值完全一样，所以数据库无法利用索引的数据来避免任何排序运算。

　　3、Hash索引不能利用部分索引查询

　　对于组合索引，Hash索引在计算Hash值的时候是组合索引键合并后再一起计算Hashs值，而不是单独计算Hash值，所以通过组合索引的前面一个或者几个索引键进行查询的时候，Hash索引也无法被利用。

　　4、Hash索引在任何时候都不能避免表扫描

　　前面已经知道，Hash索引是将索引键通过Hash运算之后，将Hash运算结果的Hash值和对应的行指针信息存放于一个Hash表中，由于不同索引键存在相同Hash值，所以即使取满足某个Hash键值的数据的记录条数，也无法从Hash索引中年直接完成查询，还要通过访问表中实际数据进行相应的比较，并得到相应的结果。

　　5、Hash索引遇到大量Hash值相等的情况后性能不一定会比B-Tree索引高

　　对于选择性比较低的索引键，如果创建Hash索引，那么将会存在大量记录指针信息存于同一个Hash值相关联。这样要定位某一条记录时就会非常麻烦，会浪费多次表数据的访问，而造成整体性能低下。

posted @ 2018-10-08 13:34 周国伟阅读(4201) 评论(1) 收藏举报

刷新页面返回顶部

Stand by me（周国伟）

青春须早为，岂能长少年！

索引原理-btree索引与hash索引的区别

公告