《Mysql的整体架构是如何分层的?每层的功能都是什么?》

一:概述


首先需要对 MySQL 整体的基础架构 有个大体的认识

 

二:MySQL 的分层


MySQL 在大体上可以分为 Server 层和存储引擎层两部分

Server 层

    - Server 层包括连接器、查询缓存、分析器、优化器、执行器等,涵盖 MySQL 的大多数核心服务功能

    - 以及所有的内置函数(如日期、时间、数学和加密函数等)

    - 所有跨存储引擎的功能都在这一层实现,比如存储过程、触发器、视图等。

 存储引擎层

    - 而存储引擎层负责数据的存储和提取。

    - 其架构模式是插件式的,支持 InnoDB、MyISAM、Memory 等多个存储引擎。

    - 现在最常用的存储引擎是 InnoDB,它从 MySQL 5.5.5 版本开始成为了默认存储引擎。 

 

三:一条SQL语句的执行流程


当我们执行一条 SQL :  SELECT * FROM {table}; 

 

1:连接器


当在 Shell 中连接 Mysql 服务 mysql -h$ip -P$port -u$user -p , 在完成 TCP 握手连接之后,连接器即开始身份认证

如果用户名或密码不对,你就会收到一个 "Access denied for user" 的错误,然后客户端程序结束执行。

如果用户名密码认证通过,连接器会到权限表里面查出你拥有的权限。

之后,这个连接里面的权限判断逻辑,都将依赖于连接时读到的权限

QA

  - 根据这里的身份认证可以知道,权限的认证,是在连接 Mysql 时完成的。

  - 所以,即使管理员在连接状态时修改了权限,也不会影响已经存在的连接。之后的链接才会使用新的权限状态。

 

连接完成后,若没有任何操作,连接就处于休眠状态,用命令  show processlist;  查看,就是  Sleep  状态的进程:

   - 客户端如果太长时间没动静,连接器就会自动将它断开。

  - 这个时间是由参数  wait_timeout  控制的,默认值是 8 小时

  - 如果在连接被断开之后,客户端再次发送请求的话,就会收到一个错误提醒:  Lost connection to MySQL server during query。 

  - 这时候如果你要继续,就需要重连,然后再执行请求了。

 

1.1 长链接和短连接


 数据库里面,长连接是指连接成功后,如果客户端持续有请求,则一直使用同一个连接。

短连接则是指每次执行完很少的几次查询就断开连接,下次查询再重新建立一个。

建议使用长链接的,因为建立连接的过程比较复杂,应该尽量减少建立连接的动作。

 

1.2 长连接的管理


使用长连接后,随着连接数不断增加,会导致内存占用升高,因为 MySQL 在操作过程中会占用内存来管理连接对象,这些资源会在连接断开的时候才释放

所以如果长连接累积下来,可能导致内存占用太大,被系统强行杀掉(OOM),从现象看就是 MySQL 异常重启了。

解决方案:

  1. 定期断开长连接并重启。

  2. 如果你用的是 MySQL 5.7 或更新版本,可以在每次执行一个比较大的操作后,通过执行 mysql_reset_connection  来重新初始化连接资源。

在实际的项目中,使用连接池来管理长连接。

 

2:查询缓存


 MySQL 拿到一个查询请求后,会先到查询缓存查询

如果你的查询能够直接在这个缓存中找到 key,那么这个 value 就会被直接返回给客户端。

但是大多数情况下我会建议你不要使用查询缓存,为什么呢?因为查询缓存往往弊大于利。

查询缓存的失效非常频繁,只要有对一个表的更新,这个表上所有的查询缓存都会被清空。

因此很可能你费劲地把结果存起来,还没使用呢,就被一个更新全清空了。

对于更新压力大的数据库来说,查询缓存的命中率会非常低

除非你的业务就是有一张静态表,很长时间才会更新一次。

比如,一个系统配置表,那这张表上的查询才适合使用查询缓存。

在 MySQL 8.0 中,缓存功能彻底被废弃。

  

3:分析器


解析SQL 语句

分析整个的 SQL 动作

 
4:优化器
选择查找记录的最优方案
 
  
5:执行器
调用存储引擎执行
 
QA:

1. 如果表 T 中没有字段 k,而执行了这个语句 select * from T where k=1, 那肯定是会报错: Unknown column ‘k’ inwhere clause 错误是在哪个阶段报出来的呢?
  - 分析器阶段。
  - 分析器处理语法和解析查询, 会生成一课对应的解析树。
  - 分析器会检查解析树的合法。比如: 数据表和数据列是否存在, 别名是否有歧义等。
  - 如果通过则生成新的解析树,才会再提交给优化器。
posted @ 2019-05-27 19:37  Zzz哈  Views(1424)  Comments(0Edit  收藏  举报