聚簇索引和非聚簇索引(一级索引和二级索引)

关于聚簇索引和非聚簇索引我们这里是根据MySQL的InnoDB存储引擎来讲的,MyISam存储引擎没有聚簇索引。

假设我们有一个Student表,我们结合这个表来讲解

聚簇索引(也叫一级索引)

先上结构图,便于理解

聚簇索引的结构是一颗B+树,并且叶子节点存放的就是行数据,索引和数据紧密结合,所以叫聚簇索引。

聚簇索引不用我们手动创建,创建表的时候存储引擎会自动根据自增主键当做 key 来创建聚簇索引,如果没有主键,会选择非空唯一索引,如果没有唯一索引,会隐式的生成一个名为row_id的列作为聚簇索引。

聚簇索引的叶子节点存放的是行数据,这种结构使得数据行的物理顺序与索引的逻辑顺序一致,故一个表只能有一个聚簇索引。

优点:

  1. 数据访问超快:由于叶子节点存储的就是行数据,所以访问数据超快。
  2. 范围查询性能优越:由于数据行在物理上按照索引顺序排列,因此在进行范围查时,一旦找到范围中的第一个数据行,后续的数据行就会物理上毗连在一起,从而避免了大范围扫描,提高了查询效率。

缺点:

  1. 如果不是按照主键的顺序在表最后插入,可能会导致索引的分裂和重组,从而影响插入性能。
  2. 更新主键值会导致行移动,进而导致索引分裂和重组。
  3. 删除行也会导致索引分裂和重组,所以最好逻辑删除,不影响整个索引结构。

非聚簇索引(也叫二级索引)

同样先上结构图

非聚簇索引的结构也可以是B+树,叶子节点存的除索引值外,还有聚簇索引的索引值。

非聚簇索引查找行数据需要查找两次,第一次查找是根据值找到非聚簇索引叶子节点的聚簇索引的 key,第二次是根据该 key 查找聚簇索引叶子节点的行数据。第二次查找的过程叫做回表

我们自己定义的索引都是非聚簇索引。

特点:

  • 索引与数据分开存储:非聚簇索引将索引和数据分开存储。
  • 查询效率相对较低:由于索引和数据分开存储,查询时需要先查找聚簇索引,再根据聚簇索引找到对应的数据行,因此查询效率相对较低。
  • 数量灵活:一个表可以有多个非聚簇索引,以满足不同的查询需求。

总结

聚簇索引是根据主键构造的一颗B+树,叶子节点存储行数据,查找只需一次效率高;非聚簇索引叶子节点存的是主键的key,查询需要两次效率相对较低,但是可以创建多个。

posted @ 2024-09-12 10:19  凡人编程传(Java)  阅读(28)  评论(0编辑  收藏  举报