MySQL 读书笔记(一)
1 MySQL 表
1.1 索引组织表
在 InnoDB 存储引擎中,表都是根据主键顺序存放的,这种存储方式称为索引组织表。
InnoDB存储引擎中,每张 MySQL表 都有一个唯一主键,如果创建表时没有显式定义主键,InnoDB存储引擎会按照下述规则选择或创建主键:
- 首先判断表中是否有非空且唯一的字段 (Unique Not Null),如果有,则该列即为主键
- 如果表中有多个非空且唯一的字段,则选择建表时第一个定义的非空且唯一的字段为主键
- 如果没有上述字段,则创建一个 6子节 大小的指针
/**
* 该表有 c,d 两个字段被定义为 Unique Not Null
* 但先定义的是 d 的索引, 所以该表的主键为 d
*/
CREATE TABLE t (
a INT NOT NULL,
b INT NULL,
C INT NOT NULL,
D INT NOT NULL,
UNIQUE KEY(b),
UNIQUE KEY(d),
UNIQUE KEY(c)
);
1.2 表空间
在 InnoDB 存储引擎下,所有的数据都被逻辑地存放在表空间。
表空间的组成结构如下图所示:Tablespace -> Segment -> Extent -> Page -> Row
1.3 段
表空间由各个段组成,一般有数据段、索引段、回滚段等。
在 InnoDB 引擎下,表是索引组织的,所以数据段和索引段可以分别表述为:
- 数据段 —— B+树的叶子节点
- 索引段 —— B+树的非叶子节点
1.4 区
默认情况下,InnoDB存储引擎中,区的大小为1MB,页的大小为16KB,即一个区中包含64个连续的页。可以通过参数调整页的大小为 2KB, 4KB, 8KB
等,但区的大小始终保持1MB,不能调整。
1.5 页
页是 InnoDB 磁盘管理的最小单位,可以通过 innodb_page_size
参数设置页的大小。
常见的页类型有:
- 数据页
- undo页
- 系统页
- 事务数据页
1.6 行
InnoDB 存储引擎中,记录以行的形式存储,页中保存着一行行的数据。
InnoDB 文件格式与行格式
- Antelope文件格式:对应 COMPACT 和 REDUNDANT 行格式
- Barracuda文件格式:对应 COMPRESSED 和 DYNAMIC 行格式
在 MySQL 8中,默认使用 Dynamic 行格式
行溢出数据
如果当前页只能存放一条行记录(B+树失去了意义,退化成链表),则 InnoDB 存储引擎会自动将行数据放到溢出页(BLOB Page)中,而数据页中只保留 768 字节的前缀数据。
Compact 格式
Compact格式的设计目标是高效地存储数据,下图为其存储方式。
- 变长字段长度列表:1/2字节,表示列的长度
- NULL标志位:1字节,表示行中是否有 NULL 值
- 记录头信息:5字节
- 列数据:除用户定义的列外,还包括两个隐藏列(事务ID列和回滚指针列),NULL值不占该部分任何空间
Redundant 格式
Redundant 是 MySQL 为了兼容之前版本的页格式,其存储格式如下所示。
字段长度偏移列表 | 记录头信息 | 列数据 | ....... |
- 字段长度列表:1/2字节
- 记录头信息:6字节
- 列数据:相较于 Compact 行格式,Redundant 格式的
CHAR
类型 Null 值需要占用空间
Compressed 与 Dynamic 格式
这两种行记录格式对于存放在 BLOB 中的数据采用了完全行溢出的方式。相较于之前768字节的前缀数据,这两种行记录格式在数据页中只存放20字节的指针,而实际的数据都存放在Off Page中。
Compressed 行记录格式的另一个特定是它会对存储的行数据以 zlib 算法进行压缩,对于 BLOB、TEXT、VARCHAR等大长度类型的数据能够有效存储。
1.7 Named File Formats 机制
随着 InnoDB 存储引擎的发展,新的页数据结构需要支持新的功能特性,而这些新的页数据结构和之前的页结构并不兼容,因此 InnoDB 存储引擎通过 Named File Formats 机制来解决兼容性问题。
如下图所示,新的文件格式总是包含之前版本的页格式。
1.8 约束
几乎所有的关系型数据库都提供约束机制,该机制用来保证数据库中数据的完整性。
- 实体完整性:保证表中有一个主键
- 数据完整性:可通过触发器保证
- 域完整性:保证每列数据值满足特定的条件
InnoDB 存储引擎提供以下几种约束:
- Primary Key:主键约束
- Unique Key:唯一约束
- Foreign Key:外键约束
- Default:默认值约束
- NOT NULL:非空约束
1.9 视图
视图是一个命名的虚表,由 SQL 查询定义,可当作表使用,但视图中的数据没有实际的物理存储。
视图的主要用途是被当做一个抽象层,程序本身不需要关心基表的结构,只需要按照视图定义来获取数据或者更新数据。
# Create View Command
CREATE VIEW view_name [(column_list)]
AS
select_statement
[WITH CHECK OPTION]
视图更新
对于某些视图来说是可更新的,即可以使用 UPDATE、DELETE 和 INSERT 等语句来更新基本表中的内容。
对于可更新的视图,需要保证视图中的行记录和表中的行记录是一对一的关系。
如果视图中包含以下结构中的任何一种,则其是不可更新:
- 聚合函数 SUM(),MIN(),MAX(),COUNT() 等
- DISTINCT 关键字
- GROUP BY 子句
- HAVING 子句
- UNION 或 UNION ALL 运算符
- FROM 自不可更新视图
- ALGORITHM 选项为 TEMPTABLE