07-MySQL 架构介绍

1. MySQL 逻辑架构#

MySQL 与其他 DB 相比，最与众不同的点在于：它的架构可以在多种不同场景中应用并发挥良好作用，最主要体现在存储引擎的架构上。插件式的存储引擎架构将查询处理和其他的系统任务以及数据的存储提取相分离，这种架构可以根据业务的需求和实际需要选择合适的存储引擎。

整个 MySQL Server 由以下组成：

组件	功能
Connection Pool	连接池组件
Management Services & Utilities	管理服务和工具组件
SQL Interface	SQL 接口组件
Parser	查询分析器组件
Optimizer	优化器组件
Caches & Buffers	缓冲池组件
Pluggable Storage Engines	插件式存储引擎
File System	文件系统

1.1 连接层#

最上层是一些客户端和链接服务，包含本地 Socket 通信和大多数基于客户端/服务端工具实现的 TCP/IP 的通信。主要完成一些类似于连接处理、授权认证及相关的安全方案。在该层上引入了线程池的概念，为通过认证安全接入的客户端提供线程。同样在该层上可以实现基于 SSL 的安全链接。服务器也会为安全接入的每个客户端验证它所具有的操作权限。

1.2 服务层#

在此层中完成了大多的核心服务功能。包括查询解析、分析、优化、缓存以及所有的内置函数（例如，日期、时间、数学和加密函数），所有跨存储引擎的功能都在这一层实现：存储过程、触发器、视图等。

SQL Interface：接受用户的 SQL 语句，并且返回用户需要查询的结果。
Parser：解析器，区分 SQL 语句的类型，转发给对应的处理模块。
Optimizer：查询优化器，在执行查询 SQL 之前会使用查询优化器进行优化，如 SQL 的执行顺序、是否使用索引等。
其他：所有跨存储引擎的功能也是在这一层实现的，如存储过程、函数就在该层解析执行。

【查询说明】在该层，服务器会解析查询并创建相应的内部解析树，并对其完成相应的优化，如：确定查询表的顺序，是否利用索引等，最后生成相应的执行操作。如果是 SELECT 语句，服务器还会查询内部的缓存。如果缓存空间足够大，那么在解决大量读操作的环境中就能够很好的提升系统的性能。

1.3 引擎层#

存储引擎层真正负责 MySQL 中数据的存储和提取，服务器通过 API 与存储引擎进行通信，这些接口屏蔽了不同存储引擎之间的差异，使得这些差异对上层的查询过程透明。存储引擎 API 包含几十个底层函数，用于执行诸如“开始一个事务”或者“根据主键提取一行记录”等操作。但存储引擎不会去解析 SQL，不同存储引擎之间也不会相互通信，而只是简单地响应上层服务器的请求。

不同的存储引擎的功能也不同，可以根据业务来选择具体的存储引擎。常用的存储引擎有两种：MylSAM 和 InnoDB。

1.4 存储层#

数据存储层主要是将数据存储在运行于裸设备的文件系统之上，并完成与存储引擎的交互。

2. 主要配置文件#

3. MySQL 存储引擎#

3.1 概述#

和大多数的数据库不同，MySQL 中有一个存储引擎的概念，针对不同的存储需求可以选择最优的存储引擎。

存储引擎就是存储数据、建立索引、更新查询数据等等技术的实现方式。存储引擎是基于表的，而不是基于库的，所以存储引擎也可被称为表类型。

Oracle，SQL server 等数据库只有一种存储引擎。MySQL 提供了插件式的存储引擎架构，所以 MySQL 存在多种存储引擎，可以根据需要使用相应引擎，或者编写存储引擎。

MySQL 5.0 支持的存储引擎包含：InnoDB、MyISAM、BDB、MEMORY、MERGE、EXAMPLE、NDB Cluster、ARCHIVE、CSV、BLACKHOLE、FEDERATED 等，其中 InnoDB 和 BDB 提供事务安全表，其他存储引擎是非事务安全表。

查看 MySQL 提供什么存储引擎：show engines;

查看 MySQL 当前默认的存储引擎：show variables like "%storage_engine%";

创建新表时如果不指定存储引擎，那么系统就会使用默认的存储引擎，MySQL 5.5 之前的默认存储引擎是 MyISAM，5.5 之后就改为了 InnoDB。

3.2 各种存储引擎特性#

下面重点介绍几种常用的存储引擎，并对比各个存储引擎之间的区别，如下表所示：

a. InnoDB#

InnoDB 存储引擎是 MySQL 的默认存储引擎。InnoDB 存储引擎提供了具有提交、回滚、崩溃恢复能力的事务安全。但是对比 MyISAM 的存储引擎，InnoDB 写的处理效率差一些，并且会占用更多的磁盘空间以保留数据和索引。

InnoDB 存储引擎不同于其他存储引擎的特点：事务控制、外键约束、存储方式。

外键约束

MySQL 支持外键的存储引擎只有 InnoDB，在创建外键的时候，要求父表必须有对应的索引，子表在创建外键的时候，也会自动的创建对应的索引。
在创建索引时，可以指定在删除、更新父表时，对子表进行的相应操作，包括 RESTRICT、CASCADE、SET NULL 和 NO ACTION。
- RESTRICT 和 NO ACTION 相同，是指限制在子表有关联记录的情况下，父表不能更新；
- CASCADE 表示父表在更新或者删除时，更新或者删除子表对应的记录；
- SET NULL 则表示父表在更新或者删除的时候，子表的对应字段被 SET NULL 。
针对有外键关系的两个表，若子表的外键指定是 ON DELETE RESTRICT / ON UPDATE CASCADE 方式，那么在主表删除记录的时候，如果子表有对应记录，则不允许删除，主表在更新记录的时候，如果子表有对应记录，则子表对应更新。

InnoDB 存储表和索引有以下两种方式：

使用共享表空间存储，这种方式创建的表的表结构保存在 .frm 文件中，数据和索引保存在 innodb_data_home_dir 和 innodb_data_file_path 定义的表空间中，可以是多个文件。
使用多表空间存储，这种方式创建的表的表结构仍然存在 .frm 文件中，但是每个表的数据和索引单独保存在 .ibd 中。

b. MyISAM#

MyISAM 不支持事务、也不支持外键，其优势是访问的速度快，对事务的完整性没有要求或者以 SELECT、INSERT 为主的应用基本上都可以使用这个引擎来创建表。

有以下 2 个比较重要的特点：

不支持事务
文件存储方式：每个 MyISAM 在磁盘上存储成 3 个文件，其文件名都和表名相同，但拓展名分别是 .frm (存储表定义)、.MYD (MYData，存储数据)、.MYI (MYIndex，存储索引)。

MyISAM 和 InnoDB

c. MEMORY#

Memory 存储引擎将表的数据存放在内存中。每个 MEMORY 表实际对应一个磁盘文件，格式是 .frm，该文件中只存储表的结构，而其数据文件，都是存储在内存中，这样有利于数据的快速处理，提高整个表的效率。MEMORY 类型的表访问非常地快（默认使用 HASH 索引），因为他的数据是存放在内存中的，所以服务一旦关闭，表中的数据就会丢失。

d. MERGE#

MERGE 存储引擎是一组 MyISAM 表的组合，这些 MyISAM 表必须结构完全相同，MERGE 表本身并没有存储数据，对 MERGE 类型的表可以进行查询、更新、删除操作，这些操作实际上是对内部的 MyISAM 表进行的。

对于 MERGE 类型表的插入操作，是通过 INSERT_METHOD 子句定义插入的表，可以有 3 个不同的值，使用 FIRST 或 LAST 值使得插入操作被相应地作用在第一或者最后一个表上，不定义这个子句或者定义为 NO，表示不能对这个 MERGE 表执行插入操作。

可以对 MERGE 表进行 DROP 操作，但是这个操作只是删除 MERGE 表的定义，对内部的表是没有任何影响的。

3.3 存储引擎的选择#

在选择存储引擎时，应该根据应用系统的特点选择合适的存储引擎。对于复杂的应用系统，还可以根据实际情况选择多种存储引擎进行组合。以下是几种常用的存储引擎的使用环境。

InnoDB：是 MySQL 的默认存储引擎，用于事务处理应用程序，支持外键。如果应用对事务的完整性有比较高的要求，在并发条件下要求数据的一致性，数据操作除了插入和查询以外，还包含很多的更新、删除操作，那么 InnoDB 存储引擎是比较合适的选择。InnoDB 存储引擎除了有效的降低由于删除和更新导致的锁定，还可以确保事务的完整提交和回滚，对于类似于计费系统或者财务系统等对数据准确性要求比较高的系统，InnoDB 是最合适的选择。
MyISAM：如果应用是以读操作和插入操作为主，只有很少的更新和删除操作，并且对事务的完整性、并发性要求不是很高，那么选择这个存储引擎是非常合适的。
MEMORY：将所有数据保存在 RAM 中，在需要快速定位记录和其他类似数据环境下，可以提供几块的访问。MEMORY 的缺陷就是对表的大小有限制，太大的表无法缓存在内存中，其次是要确保表的数据可以恢复，数据库异常终止后表中的数据是可以恢复的。MEMORY 表通常用于更新不太频繁的小表，用以快速得到访问结果。
MERGE：用于将一系列等同的 MyISAM 表以逻辑方式组合在一起，并作为一个对象引用他们。MERGE 表的优点在于可以突破对单个 MyISAM 表的大小限制，并且通过将不同的表分布在多个磁盘上，可以有效的改善 MERGE 表的访问效率。这对于存储诸如数据仓储等 VLDB 环境十分合适。

4. 查询的执行路径#

客户端将查询发送到服务器；
服务器检查查询缓存。如果找到了，就从缓存中返回结果，否则进行下一步；
服务器解析、预处理和优化查询，生成执行计划；
执行引擎调用存储引擎 API 执行查询；
服务器将结果发送回客户端。

posted @ 2020-11-05 11:58 tree6x7 阅读(106) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布：重大改进与新特性概览！
· AI与.NET技术实操系列（二）：开始使用ML.NET
· 单线程的Redis速度为什么快？

Loading

◥(ฅºωºฅ)◤