Mysql 行格式
Mysql 目前有4种行格式:Redundant、Compact、Dynamic、Compressed
Version 5.6 已经默认使用 Compact
Version 5.7 默认使用Dynamic
Redundant 是比较老的数据格式,Compressed 不能应用在System data;所以Compact和Dynamic应用较广泛;
规定(只讨论InnoDB):
1、存储单元为页(page),16KB(16384B)
2、每页至少需要存两条数据
3、每条记录都会有记录头
4、记录几乎都会有3个隐藏列(rowId,transactionId,rollPointer)
Compact:
变长字段(记录的长度)列表 + NULL列表 + 记录头信息 + 列值
变长字段(记录的长度)列表:
采用1-2个字节来表示一个字段的长度,逆序;
字段最大长度<= 255字节用1个字节表示;大于255字节,但是实际使用字节<=127,也使用1个字节来表示;其他情况使用2个字节来表示;
char如果是变长字符集(GBK、UTF8)也会需要使用变长字段列表来存储字段使用的长度;
NULL列表:
逆序,存储每条记录中允许为NULL的字段,将实际为NULL的字段用1表示,实际不为NULL的字段用0表示;
每一列不是用一个字节来表示,而是用一个位来表示;
记录头信息:
使用5个字节来表示;
主要包含:该记录是否被删除,记录类型,下一条记录的相对偏移量;
Redundant:
字段长度偏移列表 + 记录头 + 列值
字段长度偏移列表,用来记录每列的结束位置;
真实数据(整条记录)<=127B 用1个字节记录,其他使用2个字节;
是使用1个字节还是2个字节来存储,该信息放在记录头的(1byte_offs_flag属性上)
每个列记录的第一个bit 使用来表示该列是否位NULL;
Dynamic:
与Compact行格式很像,差异在于页面溢出的处理上;
Compressed:
在于Dynamic使用了压缩算法;
页溢出:
因为每页16KB,至少存储两行,所以每行大概有8KB的数据;抛开记录头信息等,大致每列超过768B就会产生页溢出;
Compact:
1、会将溢出的数据单独放入一个页;外加20B存储额外页的信息(plus the 20-byte pointer to the externally stored part)
2、索引可以使用前768B
Dynamic:
2、如果页溢出,则使用20B存储整个列信息(列数据都存储在溢出页上)(with the clustered index record containing only a 20-byte pointer to the overflow page)
3、可以使用前3072B字符的索引(--innodb-large-prefix决定)
总的说来,Redundant使用更多的字节数量来存储一条记录(字段长度偏移列表),页溢出会使用更多的20B来表示溢出部分(或整列)数据,会使得索引数据更大;
参考:
https://dev.mysql.com/doc/refman/5.7/en/innodb-row-format.html