mysql之并行复制

#####################################

注意：开启并行复制后，如果想要Xtrabackup进行全量备份的话，那就必须还要开启gtid复制而不是传统的位点复制

问题描述：

随着业务的规模越来越大，数据库的读写压力也会越来越大，一般地，mysql的架构为一主多从，实现读写分离，读的压力往往可以通过添加从库实例来解决，然而写压力就只有主库独自承担，主库可以并行写入数据。

而从库在默认情况下，只能单线程重放主库的binlog，从库通过一个io线程去拉取主库的binlog并写到从库的relay log，然后再通过从库的一个sql线程将relay log重放一次，通常地主库和从库均部署在同一个机房，因此io线程不会是性能瓶颈，sql线程往往才是性能的瓶颈。

这个时候，主库写数据压力大，这就导致从库的sql线程来不及消化relay log，也就是主库写数据量很大，但是从库重放relay log的速度太慢，这就导致一个严重的问题，主从延迟越来越大，那么从从库读取的数据就很久之前的过期数据了。

如何解决：在线开启从库的并行复制，同时将开启双0：

MySQL5.6的并行复制是基于数据库级别的，不同数据库的事务可以同时进行binlog重放。如果用户的MySQL数据库实例中存在多个schema，对于从机复制的速度的确可以有比较大的帮助；如果在MySQL 5.6版本开启并行复制功能，那么SQL线程就变为了coordinator线程，如果用户实例仅有一个库，那么就无法实现并行回放，甚至性能会比原来的单线程更差
MySQL5.7中兼容了MySQL5.6的并行复制方案，用参数slave_parallel_type进行兼容，如果设置为database，则使用5.6版本的数据库级别的并行复制，如果设置为logical_clock，则是全新的并行复制方案。而slave_parallel_workers的值代表并行复制sql_thread的worker线程个数。一个组提交的事务都是可以并行回放，因为这些事务都已进入到事务的prepare阶段，则说明事务之间没有任何冲突（否则就不可能提交）。若将slave_parallel_workers设置为0，则MySQL 5.7退化为原单线程复制，但将slave_parallel_workers设置为1，则SQL线程功能转化为coordinator线程，但是只有1个worker线程进行回放，也是单线程复制。然而，这两种性能却又有一些的区别，因为多了一次coordinator线程的转发，因此slave_parallel_workers=1的性能反而比0还要差。MySQL5.7中，对于并行复制进行了大刀阔斧的改革，它的思路是所有处于redo log prepare阶段的事务，都可以并行提交，原因是这些事务都已经经过了锁资源争用的阶段，都是没有冲突的。这个结论我们可以进行反证，如果这些事务之间有冲突，则后来的事务会等待前面的事务释放锁之后才能执行，因此，这些事务就不会进入prepare阶段。MySQL5.7 版本的基于逻辑时钟的并行复制，是基于组提交的原理来实现的，首先在主库满足能组提交的事务，都是可以并行回放，因为这些事务都已进入到事务的 prepare 阶段，则说明事务之间没有任何冲突（否则就不可能提交）。但他没有完全模拟主库上的并发执行，所以在从库上的回放力度依然没有主库高，但比 MySQL5.6 鸡肋的基于 database 的并行复制强多了，这个时候已经能消灭大多数复制延迟了。MySQL5.7.22 开始官方推出了基于 writeset 的并行复制，他能把并行复制推到了全新的高度，怎么说呢？就是主库原本不是并行的 SQL，只要不冲突在从库上都能并行，极限情况下，从库回放速度甚至比主库还高！这基本上是消灭了这个原因下的复制延迟。

coordinator就是原来的sql_thread，不过现在它不再直接更新数据了，只负责读取中转日志和分发事务。真正更新日志的，变成了worker线程。而worker线程的个数就是由参数slave_parallel_workers决定的 coordinator在分发的时候，需要满足以下两个基本要求：

不能造成更新覆盖。这就要求更新同一行的两个事务，必须被分发到同一个worker中
同一个事务不能被拆开，必须放到同一个worker中

其实只要能够达到redo log prepare阶段就表示事务已经通过锁冲突的检验了因此，MySQL5.7并行复制策略的思想是：

同时处于prepare状态的事务，在备库执行时是可以并行的
处于prepare状态的事务，与处于commit状态的事务之间，在备库执行时也是可以并行的

MySQL5.7.22增加了一个新的并行复制策略，基于WRITESET的并行复制，新增了一个参数binlog-transaction-dependency-tracking用来控制是否启用这个新策略。这个参数的可选值有以下三种：

COMMIT_ORDER，根据同时进入prepare和commit来判断是否可以并行的策略
WRITESET，表示的是对于事务涉及更新的每一行，计算出这一行的hash值，组成集合writeset。如果两个事务没有操作相同的行，也就是说它们的writeset没有交集，就可以并行
WRITESET_SESSION，是在WRITESET的基础上多了一个约束，即在主库上同一个线程先后执行的两个事务，在备库执行的时候，要保证相同的先后顺序

为了唯一标识，hash值是通过库名+表名+索引名+值计算出来的。如果一个表上除了有主键索引外，还有其他唯一索引，那么对于每个唯一索引，insert语句对应的writeset就要多增加一个hash值

writeset是在主库生成后直接写入到binlog里面的，这样在备库执行的时候不需要解析binlog内容
不需要把整个事务的binlog都扫一遍才能决定分发到哪个worker，更省内存
由于备库的分发策略不依赖于binlog内容，索引binlog是statement格式也是可以的对于表上没主键和外键约束的场景，WRITESET策略也是没法并行的，会暂时退化为单线程模型

并行复制相关参数配置：

skip_slave_start                    =0                               
relay_log                           =/home/work/mysql_3306/relaylog/relay-bin 
relay_log_recovery                  =1 
master_info_repository              =table                       
relay_log_info_repository           =table                       
slave_parallel_type                 =logical_clock               
slave_parallel_workers              =4                           
loose-rpl_semi_sync_master_enabled        =1                     
loose-rpl_semi_sync_slave_enabled         =1                     
loose-rpl_semi_sync_master_timeout        =1000                   
slave_rows_search_algorithms = 'INDEX_SCAN,HASH_SCAN' 
binlog_group_commit_sync_delay      =500                         
binlog_group_commit_sync_no_delay_count = 13                     
binlog_transaction_dependency_tracking  = WRITESET               
transaction_write_set_extraction        = XXHASH64

1) 开启双0，提高性能，降低安全性，从库实例较多，挂掉一个从库实例没啥影响

mysql> set global sync_binlog=0; 

mysql> set global innodb_flush_log_at_trx_commit=0;

2)查看当前并行复制配置：

mysql> show variables like 'slave_parallel_%';

+------------------------+---------------+

| Variable_name          | Value         |

+------------------------+---------------+

| slave_parallel_type    | database |

| slave_parallel_workers | 0             |

+------------------------+---------------+

2 rows in set (0.00 sec)

# slave-parallel-type        默认值为database，但是针对只有一个数据库的集群而言，配置为database就没意义了，建议配置为logical_clock

# slave-parallel-workers      默认值为0，建议至少配置为4

3)关闭sql线程：

在线开启：

mysql> stop slave sql_thread;

Query OK, 0 rows affected (0.07 sec)

4)开启基于组提交的并行复制

mysql> set global slave_parallel_type='LOGICAL_CLOCK';

Query OK, 0 rows affected (0.00 sec)

5)配置从库worker线程数，不要配置为0和1，建议至少配置为4

mysql> set global slave_parallel_workers=16;

Query OK, 0 rows affected (0.00 sec)

6)开启sql线程：

mysql> start slave sql_thread;

Query OK, 0 rows affected (0.06 sec)

root@10.10.10.10 ((none)) > show slave status\G
*************************** 1. row ***************************
               Slave_IO_State: Queueing master event to the relay log
                  Master_Host: 10.10.10.11
                  Master_User: mysqlsync
                  Master_Port: 3306
                Connect_Retry: 60
              Master_Log_File: mysql-bin.037977
          Read_Master_Log_Pos: 766436384
               Relay_Log_File: relay-bin.111125
                Relay_Log_Pos: 766243914
        Relay_Master_Log_File: mysql-bin.037977
             Slave_IO_Running: Yes
            Slave_SQL_Running: Yes
              Replicate_Do_DB: 
          Replicate_Ignore_DB: 
           Replicate_Do_Table: 
       Replicate_Ignore_Table: 
      Replicate_Wild_Do_Table: 
  Replicate_Wild_Ignore_Table: 
                   Last_Errno: 0
                   Last_Error: 
                 Skip_Counter: 0
          Exec_Master_Log_Pos: 766243709
              Relay_Log_Space: 766436825
              Until_Condition: None
               Until_Log_File: 
                Until_Log_Pos: 0
           Master_SSL_Allowed: No
           Master_SSL_CA_File: 
           Master_SSL_CA_Path: 
              Master_SSL_Cert: 
            Master_SSL_Cipher: 
               Master_SSL_Key: 
        Seconds_Behind_Master: 0
Master_SSL_Verify_Server_Cert: No
                Last_IO_Errno: 0
                Last_IO_Error: 
               Last_SQL_Errno: 0
               Last_SQL_Error: 
  Replicate_Ignore_Server_Ids: 
             Master_Server_Id: 113123925
                  Master_UUID: 465c12f1-bbc2-11ea-9fcb-e4434be4b111
             Master_Info_File: mysql.slave_master_info
                    SQL_Delay: 0
          SQL_Remaining_Delay: NULL
      Slave_SQL_Running_State: Slave has read all relay log; waiting for more updates
           Master_Retry_Count: 86400
                  Master_Bind: 
      Last_IO_Error_Timestamp: 
     Last_SQL_Error_Timestamp: 
               Master_SSL_Crl: 
           Master_SSL_Crlpath: 
           Retrieved_Gtid_Set: 
            Executed_Gtid_Set: 
                Auto_Position: 0
         Replicate_Rewrite_DB: 
                 Channel_Name: 
           Master_TLS_Version: 
1 row in set (0.04 sec)

Mon Aug 30 10:41:29 2021

优化选项：

启用table模式是因为如果在多线程模式下，会频繁更新master.info文件，消耗代价过高，并且此值也不是非常准确

master_info_repository=table  对应的表为mysql.slave_master_info

relay_log_recovery=on          

relay_log_info_repository=table 对应的表为mysql.slave_relay_log_info

my.cnf对应的配置如下：

# slave
slave-parallel-type=LOGICAL_CLOCK
slave-parallel-workers=16
master_info_repository=TABLE
relay_log_info_repository=TABLE
relay_log_recovery=ON
innodb_flush_log_at_trx_commit=0
sync_binlog=0

#####################################

posted @ 2021-08-30 10:54 igoodful 阅读(992) 评论(1) 收藏举报

刷新页面返回顶部

igoodful

一枚数据库管理员（DBA），从事的数据库有：MySQL，PostgreSQL，Redis，MongoDB

mysql之并行复制

问题描述：

如何解决：在线开启从库的并行复制，同时将开启双0：

并行复制相关参数配置：

my.cnf对应的配置如下：

公告