MySQL的数据在磁盘上如何存储？

存储引擎

百度百科是这样定义存储引擎的：MySQL 中的数据用各种不同的技术存储在文件（或者内存）中，这些不同的技术以及配套的相关功能在 MySQL 中被称作存储引擎。

简单来说就是不同的存储引擎，我们的数据存储的格式也会不一样。就好比图片有不同的格式，比如：.jpg, .png, .gif 等等……

“扫盲：存储引擎是作用在表上的。”

现在 MySQL 中常用的存储引擎有两种：MyISAM 和 InnoDB。

MySQL 5.5之前，MyISAM 是默认的存储引擎。

MySQL 5.5开始，InnoDB 是默认的存储引擎。

主要区别

| MyISAM | InnoDB |

| --- | --- | --- |

| 事务 | 不支持❌ | 支持 |

| 表/行锁 | 只有表锁 | 还引入了行锁 |

| 外键 | 不支持❌ | 支持✔ |

| 全文索引 | 支持✔ | 版本5.6 开始支持 |

| 读写速度 | 更快 | 更慢 |

MyISAM 最致命的一点就是不支持事务，而 InnoDB 支持。所以现在 InnoDB 已经成为我们使用的标配、最主流的存储引擎了。

聚集（聚簇）索引

聚集索引：叶子节点包含了完整的数据记录。

简单来说就是索引和它所在行的其它列数据全部都在一起了。

很显然，MyISAM 没有聚集索引，InnoDB 有，而且 InnoDB 的主键索引就是天然的聚集索引。

有聚集索引当然就有非聚集索引（稀疏索引）。对于 MyISAM 来说，它的索引就是非聚集索引。因为它的索引和数据是分开两个文件存的：一个 .MYI 存索引，一个 .MYD 存数据。

为什么 DBA 都建议表中一定要有主键，而且推荐使用整型自增？

“注意：这里是推荐，没说一定。非要用 UUID 也不拦着你😁”

为什么要有主键？

因为 InnoDB 表里面的数据必须要有一个 B+tree 的索引结构来组织、维护我们的整张表的所有数据，从而形成 .idb 文件。

那和主键有什么关系？

如果 InnoDB 创建了一张没有主键的表，那这张表就有可能没有任何索引，则 MySQL会选择所有具有唯一性并且不为 null 中的第一个字段的创建聚集索引。

如果没有唯一性索引的字段就会有一个隐式字段成为表的聚集索引：而这个隐式字段，就是 InnoDB 帮我们创建的一个长度为 6字节的整数列 ROW_ID，它随着新行的插入单调增加，InnoDB 就以该列对数据进行聚集。

使用这个 ROW_ID 列的表都共享一个相同的全局序列计数器（这是数据字典的一部分）。为了避免这个 ROW_ID 用完，所以建议表中一定要单独建立一个主键字段。

为什么推荐使用整型自增？

首先整型的占用空间会比字符串小，而且在查找上比大小也会比字符串更快。字符串比大小的时候还要先转换成 ASCII 码再去比较。

如果使用自增的话，在插入方面的效率也会提高。

不使用自增，可能时不时会往 B+tree 的中间某一位置插入元素，当这个节点位置放满了的时候，节点就要进行分裂操作（效率低）再去维护，有可能树还要进行平衡，又是一个耗性能的操作。

都用自增就会永远都往后面插入元素，这样索引节点分裂的概率就会小很多。

二级索引

除聚集索引之外的所有索引都叫做二级索引，也称辅助索引。

它的叶子节点则不会存储其它所有列的数据，就只存储主键值。

底层查找过程：

每次要找数据的时候，会根据它找到对应叶子节点的主键值，再把它拿到聚集索引的 B+tree 中查找，从而拿到整条记录。

优点：保持一致性和节省空间。

转载自https://cloud.tencent.com/developer/article/1927209

posted @ 2024-06-04 18:00 liftsail 阅读(52) 评论(0) 编辑收藏举报

刷新页面返回顶部

（评论功能已被禁用）

相关博文：

· MySQL - binlog日志简介及设置

· 索引的种类

· Mysql存储引擎

· MySQL存储引擎

· MySQL—MySQL的存储引擎之InnoDB

阅读排行：
· 无需6万激活码！GitHub神秘组织3小时极速复刻Manus，手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· 什么是nginx的强缓存和协商缓存
· 一文读懂知识蒸馏
· Manus爆火，是硬核还是营销？

公告

昵称： liftsail
园龄： 3年4个月
粉丝： 8
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

liftsail

不积跬步，无以至千里；不积小流，无以成江海。

MySQL的数据在磁盘上如何存储？