MySQL架构原理之存储引擎InnoDB数据文件
MySQL架构原理之体系架构 - 池塘里洗澡的鸭子 - 博客园 (cnblogs.com)中简单介绍了MySQL的系统文件层,其中包含了数据文件。那么InnoDB的数据文件是如何分类并存储的呢?
一、InnoDB文件存储结构
InnoDB数据文件存储结构分为:
一个ibd数据文件-->Segment(段)-->Extent(区)-->Page(页)-->Row(行)。
1)Tablespace:表空间,用于存储多个ibd数据文件以及存储表的记录和索引。一个文件包含多个段。
2)Segment:段,用于管理多个Extent,分为数据段(Leaf node segment),索引段(Non-leaf node segment),回滚段(Rollbak segment)。一个表至少会有两个segment,一个管理数据,一个管理索引。没多穿件一个索引就会多两个segment。
3)Extent:区,一个区固定包含64个连续的叶,大小为1M。当表空间不足需要分配新的页资源不会一页一页分,直接分配一个区。
4)Page:页,用于存储多个Row行记录,大小为16K。包含很多种页类型,比如数据页,undo页,系统页,事务数据页,大的BLOB对象页。
5)Row:行,包含了记录的字段值,事务ID(Trx id),滚动指针(Roll pointer),字段指针(Field pointers)等信息。
Page是文件最基本的单元,无论何种类型的page,都是由page header, page trailer和page body 组成。如下图示:
二、InnoDB文件存储格式
通过show table status 命令可以看到文件的存储格式:
一般情况下,如果row_format为REDUNDANT、COMPACT,文件格式为Antelope;如果row_format为DYNAMIC和COMPRESSED,文件格式为Baracuda。
通过information_schema可以查看指定表的文件格式:select * from information_schema.innodb_sys_tables;
三、File文件格式
随着InnoDB引擎的发展,文件格式也不止单一一种了,用于支持新的功能。目前InnoDB支持的文件格式有Antelope和Barracuda。
通过innodb_file_format配置参数可以设置InnoDB文件格式,默认的是其中的一种。
四、Row文件格式
表的行格式觉得了它的行是如何物理存储的,这反过来又会影响查询和DML操作的性能。如果在单个page页中容纳更多行,查询和索引查找可以更快地工作,缓冲池中所需的内存更少,写入更新时所需的I/O更少。
InnoDB存储引擎支持四种行格式:REDUNDANT、COMPACT、 DYNAMIC和 COMPRESSED。
每个表的数据分成若干页来存储,每个页中采用B树结构存储;如果某些自动信息过长无法存储在B树结点中,这时候会被单独分配空间,此时被称为溢出页同时该字段被称为页外列。
在创建表和索引时,文件格式都被用于每个InnoDB表数据文件(其名称与*.ibd匹配)。修改文件格式的方法是重新创建表及其索引,最简单方法是对要修改的每个表使用命令:Alter Table 表名 row_format=格式类型。