索引组织表和堆表索引结构

18. 索引组织表

 

在InnoDB存储引擎中,Row都是根据主键顺序组织存放的,这种存储方式的表称为索引组织表(index organized table),或者叫聚集索引(clustered index) 

  1. 每张表必须有一个主键
  2. 根据主键的值构建一个B+树
  3. 这颗B+树的叶子节点存放所有记录
  4. 非叶子节点存放主键和指针(若干个{主键,指针}组成一个非页节点)
    1. 这里指针其实就是PageNumber,这个PageNumber就是下一层节点的PageNumber(这里不需要SpaceID,因为SpaceID对应的是ibd文件,我们现在是在ibd文件内部查找数据)

 

主键

如果创建表的时候没有显示指定主键,则InnoDB会按照如下方式选择或创建主键

  1. 判断表中是否有非空唯一索引,如果有,该列为主键
    1. 如果存在多个非空唯一索引,以创建表时第一个定义的非空唯一索引为准,而不是(columns)定义的顺序
  2. 如果上述条件都不符合,则InnoDB自动创建一个6字节大小的主键

主键实验

  • 多个非空唯一键
    root@mysqldb 13:35:  [gavin]> create table test_key(
        -> a int,  -- int类型
        -> b int not null, 
        -> c int not null,
        -> unique key(a),
        -> unique key(c),  -- C列先定义
        -> unique key(b)
        -> );
    Query OK, 0 rows affected (3.01 sec)
    
    root@mysqldb 13:37:  [gavin]> insert into test_key values(1,2,3),(4,5,6),(7,8,9);
    Query OK, 3 rows affected (0.00 sec)
    Records: 3  Duplicates: 0  Warnings: 0
    
    root@mysqldb 13:38:  [gavin]> select *, _rowid from test_key;
    +------+---+---+--------+
    | a    | b | c | _rowid |
    +------+---+---+--------+
    |    1 | 2 | 3 |      3 |
    |    4 | 5 | 6 |      6 |
    |    7 | 8 | 9 |      9 |
    +------+---+---+--------+
    3 rows in set (0.00 sec)
    
    root@mysqldb 13:41:  [gavin]> create table test_key_2 (
        -> a varchar(8), -- 使用varchar类型
        -> b varchar(8) not null,
        -> c varchar(8) not null,
        -> unique key(a),
        -> unique key(c),
        -> unique key(b)
        -> );
    Query OK, 0 rows affected (0.01 sec)
    
    root@mysqldb 13:41:  [gavin]> insert into test_key_2 values('a','b','c'),('d','e','f'),('g','h','i');
    Query OK, 3 rows affected (0.00 sec)
    Records: 3  Duplicates: 0  Warnings: 0
    
    root@mysqldb 13:41:  [gavin]> select *, _rowid from test_key_2;    -- _rowid只能是在key的类型为整型时才有效
    ERROR 1054 (42S22): Unknown column '_rowid' in 'field list'
    
    -- 可以用下面的方法查看
    -- 方法1
    root@mysqldb 13:42:  [information_schema]> select * from information_schema.COLUMNS where table_name='test_key_2' and column_key='PRI'\G
    *************************** 1. row ***************************
               TABLE_CATALOG: def
                TABLE_SCHEMA: gavin
                  TABLE_NAME: test_key_2
                 COLUMN_NAME: c
            ORDINAL_POSITION: 3
              COLUMN_DEFAULT: NULL
                 IS_NULLABLE: NO
                   DATA_TYPE: varchar
    CHARACTER_MAXIMUM_LENGTH: 8
      CHARACTER_OCTET_LENGTH: 32
           NUMERIC_PRECISION: NULL
               NUMERIC_SCALE: NULL
          DATETIME_PRECISION: NULL
          CHARACTER_SET_NAME: utf8mb4
              COLLATION_NAME: utf8mb4_0900_ai_ci
                 COLUMN_TYPE: varchar(8)
                  COLUMN_KEY: PRI
                       EXTRA: 
                  PRIVILEGES: select,insert,update,references
              COLUMN_COMMENT: 
       GENERATION_EXPRESSION: 
                      SRS_ID: NULL
    1 row in set (0.00 sec)
    
    -- 方法2
    root@mysqldb 13:44:  [gavin]> desc test_key_2;
    +-------+------------+------+-----+---------+-------+
    | Field | Type       | Null | Key | Default | Extra |
    +-------+------------+------+-----+---------+-------+
    | a     | varchar(8) | YES  | UNI | NULL    |       |
    | b     | varchar(8) | NO   | UNI | NULL    |       |
    | c     | varchar(8) | NO   | PRI | NULL    |       |
    +-------+------------+------+-----+---------+-------+
    3 rows in set (0.00 sec)

 

  • 系统定义主键
    root@mysqldb 13:50:  [gavin]> create table test_key_3(
        -> a int,
        -> b int,
        -> c int);
    Query OK, 0 rows affected (0.01 sec)
    
    root@mysqldb 13:51:  [gavin]>  insert into test_key_3 values(1,2,3),(4,5,6),(7,8,9);
    Query OK, 3 rows affected (0.01 sec)
    Records: 3  Duplicates: 0  Warnings: 0
    
    root@mysqldb 13:51:  [gavin]> select *,_rowid from test_key_3;    -- 这里无法用_rowid查看,因为系统rowid对用户是透明的
    ERROR 1054 (42S22): Unknown column '_rowid' in 'field list'

假设有a和b两张表都使用了系统定义的主键,则系统定义的主键的ID不是在表内进行单独递增的,而是全局递增 。
该系统的rowid是定义在ibdata1.ibd中的sys_rowid中,全局自增
6个字节表示的数据量为 2^48 ,通常意义上是够用的

注意:强烈建议自己显示定义主键 

 

索引组织表与堆表

  • 堆表

堆表将索引和数据分开(如MyISAM),索引中叶子节点存放的是数据的位置,而不是数据本身

 

  • 索引组织表

索引组织表将索引和数据放在了一起,索引的叶子节点(leaf page)存放了所有完整的记录(Row)。
索引即数据,数据即索引

注意:

1. 非叶子节点(Non-leaf page)中不会存放所有的数据(Row)的 {主键, PageNumber},而是从叶子节点(leaf page)中选出一个数据的主键,将这个主键和该页的PageNumber填入到非叶节点(Non-leaf page)中
2. 从逻辑上看,是一棵B+树,但是从物理上看都是每个页(非叶子节点和叶子节点)通过指针串在一起,使得逻辑有序。

 

  • 二级索引

二级索引中的叶子节点不存放数据本身,而是存放主键 

 

  • 查询数据对比
    • 堆表查询

    • 索引组织表及二级索引查询

 

Page的空间申请

  • 叶子节点(leaf page) 由 leaf page segment 进行申请空间
  • 非叶子节点(Non-leaf page) 由 Non-leaf page segment 进行申请空间

所以索引由两个段组成

  • leaf page segment
  • Non-leaf page segment

段(segment)是由区(extent)组成,申请空间就按照区(extent)进行申请(一般情况下一次申请4个区) 

 

引用:
https://www.cnblogs.com/gavin-zheng/p/18127784

posted @ 2024-10-10 22:38  心愿666  阅读(37)  评论(0编辑  收藏  举报