服务器IO瓶颈对MySQL性能的影响

【背景】

之前我们碰到一些MySQL的性能问题,比如服务器日志备份时可能会导致慢查询增多,一句简单的select或insert语句可能执行几秒,IO负载较高的服务器更容易出现并发线程数升高,CPU上升等问题。

最近学习了MySQL InnoDB IO相关的部分内核原理,可以帮我们了解服务器IO瓶颈对MySQL性能的影响,下面以MySQL5.7.23的源码为例

【原理】

1、InnoDB实现了同步IO和异步IO两种文件读写方式

(1、)对于读操作,通常用户线程触发的数据请求都是同步读,其他后台线程触发的是异步读。

(2、)对于写操作,InnoDB是WAL模式,先写日志,延迟写数据页;

redo log的写操作大部分是异步写,主要在下面场景下触发

<1、>redo log buffer空间不足时;

<2、>当参数innodb_flush_log_at_trx_commit设置为1时,每次事务提交都会做一次fsync,相当于是同步写;

<3、>master线程每秒做一次redo fsync;

<4、>checkpoint

<5、>实例shutdown时

<.6、>binlog切换时

 Page cleaner线程负责脏页的刷新操作,其中double write buffer的写磁盘是同步写,数据文件的写入是异步写。

 

2、同步读写操作通常由用户线程来完成,下面先分析同步读

当用户线程执行一句SQL时,如果请求的数据页不在buffer pool中,就需要将文件中的数据页加载到buffer pool中,

从函数buf_read_page可以看到这里是同步读操作,如果IO有瓶颈,响应延迟,那么该线程就会被阻塞。

从函数buf_page_init_for_read可以看到,在读数据页时会加X锁

这时如果有其他用户线程请求相同的数据页时,从函数buf_wait_for_read看到,尝试获取X锁,就会处于阻塞状态。

当服务器IO成为瓶颈,发生上面的问题时,就会出现SQL执行变慢

问题进一步恶化,大量慢查询,运行中的线程处于等待状态,占用了Innodb线程(innodb_thread_concurrency我们的配置大部分是0或64,实际上通常是CPU的逻辑核数40)

对于并发较高的系统,会导致其他大量的线程处于等待队列中,并发线程过高又会导致上下文切换频繁,CPU上升。

 

3、一个同步写的例子

前面做过一个测试,执行500W条insert语句

用source执行insert脚本,TPS大约在每秒700,后面并行同时执行3个insert脚本,TPS达到每秒2000左右,IO %util已经接近100%

由于此时参数innodb_flush_log_at_trx_commit设置为1时,每次事务提交都会做一次fsync,相当于是同步写,IO已达到瓶颈,TPS处理能力无法提高。

当将参数innodb_flush_log_at_trx_commit临时调整为2,改为后台进程进行异步写,并行执行8个insert脚本,TPS达到每秒约1W左右,IO %util约在8%。

实现逻辑可以关注log_write_up_to函数

 

【应用场景】

1、当服务器IO出现瓶颈,会导致MySQL性能大幅下降,因此建议尽可能的利用服务器内存资源,将实例的innodb_buffer_pool_size设置为物理内存的70%左右;

2、合理的拆分,尽可能的让一个实例的热点数据都可以缓存在innodb buffer pool中

3、对于某些场景下执行脚本,或初始化数据时,可以将innodb_flush_log_at_trx_commit临时设置为2,能大幅提升导入性能。

参考资料:

http://mysql.taobao.org/monthly/2017/03/01/

http://mysql.taobao.org/monthly/2016/02/02/

http://mysql.taobao.org/monthly/2017/07/10/

 

posted @ 2018-11-06 09:50  wangdong  阅读(6174)  评论(1编辑  收藏  举报