(5.5)mysql高可用系列——MySQL半同步复制(实践)

关键词,mysql半同步复制

【0】实验环境

操作系统:CentOS linux 7.5

数据库版本:5.7.24

数据库架构:主从复制,主库用于生产,从库用于数据容灾和主库备机,采用默认传统的异步复制。

主库IP:192.168.1.201  端口:3306

从库IP:192.168.1.202  端口:3306

 

正文:

【1】配置my.cnf

【1.1】通用复制配置

#replication_new
log_bin=/mysql/log/3306/mysql-bin #开启binlog
log_bin_index=/mysql/log/3306/mysql-bin.index
binlog_format=row
binlog_rows_query_log_events=on
max_binlog_size=2048

bind-address=0.0.0.0
server_id=2013306
expire_logs_days=7    #超过7天的binlog清理
innodb_support_xa=1
binlog_cache_size=1M
log_bin_trust_function_creators=1    #同步存储过程、函数、触发器
innodb_flush_log_at_trx_commit=1
sync_binlog=1
transaction-isolation=read-committed

relay_log=/mysql/log/3306/relaylog/mysql-relay.log
log-slave-updates=1
read_only=1
slave-parallel-type=LOGICAL_CLOCK
slave-parallel-workers=4
master_info_repository=table #master_info 会记录到 mysql.slave_master_info
relay_log_info_repository=table #relay_log 会记录到,mysql.slave_relay_log_info
relay_log_recovery=1
slave_skip_errors=ddl_exist_errors
slave_preserve_commit_order=1

【2】半同步复制配置的2种办法(5.7)


  两种办法

  【2.1】手动安装半同步复制插件(在mysql环境下,主从都安装)

    【step 1】安装半同步插件
    install plugin rpl_semi_sync_master soname 'semisync_master.so';
    install plugin rpl_semi_sync_slave soname 'semisync_slave.so';

    show plugins; -- 查看插件安装情况 or select * from mysql.plugin;
      

      
     【step 2】设置开启半同步参数

      建议都开启,以免主备切换时需要重新加;如果分开,如下图;

      在主库上:set global rpl_semi_sync_master_enabled=1;

      在从库上:set global rpl_semi_sync_slave_enabled=1;

      如果异步复制正在运行,需要在从库运行一下命令 才会使用半同步;

        stop slave io_thread;start slave io_thread;

     【step 3】检查状态

      在主库查看半同步状态:show status like '%rpl_semi%';

         

        圈出第1行表示,连接主库的客户端个数。

        圈出第2行表示,该实例做为半同步的主库状态,是on,是开启的。

        最后1行,Rpl_semi_sync_slave_status,表示该实例,作为半同步的从库状态,是off,不是从库。

        (但是从库上进行查看时,图中的 master_status 与 slave_status 应该正好相反,作为主库是关闭的,作为从库是开启的)

        其他重要参数,

          Repl_semi_sync_master_yes_tx:表示已经同步的事务数,0表示还没有任何一个事务以半同步的方式复制到从库

          Repl_semi_sync_master_no_tx:假如为3,表示当前有3事务不是半同步模式下从库及时响应的(比如可能有网络延迟,导致半同步超时切换成异步)



  【2.2】写入配置文件(推荐使用,my.cnf)

    show variables like 'plugin%'; -- 查看插件路径

#修改my.cnf 复制代码
#如果已经有异步复制了,也不需要改其他的,只需要把下面参数加入到my.cnf,重启mysql服务即可。
#如果业务不允许宕机重启实例,那么可以参考方法1,并且把该段代码加上,就可以直接用了。
plugin_dir=/mysql/app/mysql/lib/plugin/
plugin_load=rpl_semi_sync_master=semisync_master.so;rpl_semi_sync_slave=semisync_slave.so

#如果是5.7,参数前面加上loose_,如下列,如果是5.6 则直接使用 rpl_semi_sync_master_enabled=1 之类的就好了。
#我这里是5.7就直接做增强半同步了(loseless Semisynchronous )
loose_rpl_semi_sync_master_enabled=1 #MySQL开启主的半同步复制(rpl_semi_sync_master_enabled)
loose_rpl_semi_sync_slave_enabled=1 #MySQL5.6开启从的半同步复制
loose_rpl_semi_sync_master_timeout=5000 #超时5秒,切回异步
rpl_semi_sync_master_wait_for_slave_count=1 #至少收到1个slave发会的ack
rpl_semi_sync_master_wait_point=AFTER_SYNC #MySQL 5.7的方法,AFTER_SYNC(default,增强半同步) & AFTER_COMMIT(传统半同步)
rpl_semi_sync_master_wait_no_slave=on # 默认为on
  #1.为OFF时,只要master发现【Rpl_semi_sync_master_clients】小于【rpl_semi_sync_master_wait_for_slave_count】,则 master 立即转为异步模式。
  #2.为ON时,空闲时间(无事务提交)里,即使master发现【Rpl_semi_sync_master_clients】小于【rpl_semi_sync_master_wait_for_slave_count】,也不会做任何调整
# 只要保证在事务超时之前,master收到大于等于【rpl_semi_sync_master_wait_for_slave_count】值的ACK应答数量,master就一直保持在半同步模式;
# 如果在事务提交阶段(master等待ACK)超时,master才会转为异步模式。
#3.无论【rpl_semi_sync_master_wait_no_slave】为ON还是OFF,当slave上线到【rpl_semi_sync_master_wait_for_slave_count】值时,master都会自动由异步模式转为半同步模式。

 

【3】进行初始化操作

【3.1】完全同步情况

#【1】在主库和从库上 准备复制账户 
create user 'rpl'@'192.168.1.%' identified by '123456';
grant replication slave on *.* to 'rpl'@'192.168.1.%';
flush privileges;
select user,host from mysql.user;

#【
2】在主库上,设置读锁定有效。以便获取一个一致性的快照   
mysql下操作:(锁表,获取一致性)   
flush tables with read lock;

#【
3】在主库上 show master status;获取主库当前的二进制名和偏移量pos位置。  
 show master status;   
-- 查看到的日志名记录下来,比如:mysql-bin.000002 , postion: 881

#【
4】备份主库还原到从库   
逻辑方式:mysqldump。然后scp拷贝过去。然后登录上从库的mysql,直接把dump的文件加载进去即可。
物理方式:直接拷贝,备份删除从库原有data目录,然后把主库的data目录复制过去。
复制到从库后记得删除拷贝过来data
/下的auto.cnf,否则uuid会一样,导致无法复制。   
不管是物理还是逻辑方式,CP或者mysqldump完后,就都可以解锁主库了   
在主库的mysql登录下,使用命令,unlock tables;

 

【3.2】如果业务正在跑,利用备份还原恢复同步

#【1】在主库和从库上 准备复制账户 
create user 'rpl'@'192.168.1.%' identified by '123456';
grant replication slave on *.* to 'rpl'@'192.168.1.%';
flush privileges;
select user,host from mysql.user;

#【2】利用备份
#mysqldump,如果备份时加了--master-data=2参数,是有记录binlog文件和位置的。
    

#XtraBackup,也会复制Binlog文件和位置信息
    


#【3】开始还原
利用备份去进行还原,这个时候多半是不一致的,因为业务在跑。
这个时候利用备份中的binlog 来做 change master to

#【4】change master to 示例
change master to
master_host='192.168.1.201',
master_port=3306,
master_user='rep',
master_password='123456',
master_log_file='mysql-bin.000002',
master_log_pos=154;

 

【4】参数解析

 【4.1】show status like '%rpl%'; -- 查看半同步状态

主库:

Variable_name
--------------------------------------------
Rpl_semi_sync_master_clients           --已连接到本机主库的客户端输了
Rpl_semi_sync_master_net_avg_wait_time       --平均等待时间
Rpl_semi_sync_master_net_wait_time       --总等待时间
Rpl_semi_sync_master_net_waits         --等待次数
Rpl_semi_sync_master_no_times         --关闭半同步的次数
Rpl_semi_sync_master_no_tx            --没有成功同步提交的事务个数 
Rpl_semi_sync_master_status           --主库半同步状态(on为打开半同步,off为异步) 
Rpl_semi_sync_master_timefunc_failures     --调用函数失败的次数
Rpl_semi_sync_master_tx_avg_wait_time     --事务平均等待时间、平均传输时间
Rpl_semi_sync_master_tx_wait_time       --事务总等待时间 、总传输时间
Rpl_semi_sync_master_tx_waits         --事务的总等待次数
Rpl_semi_sync_master_wait_pos_backtraverse   -- 后来的事务先来了,先来的事务还没有到的次数
Rpl_semi_sync_master_wait_sessions       -- 当前有多少Session 因为slave 而造成的等待 
Rpl_semi_sync_master_yes_tx           -- 成功被slave恢复同步的事务个数 
Rpl_semi_sync_slave_status          -- 表示当前本词库是异步还是半同步(主库应该为off,从库因为on)

 

 【4.2】show variables like '%rpl%'; -- 查看半同步配置参数

 

【5】复制的日常管理

#复制的日常管理与维护

  (1)show slave status\G :在从库查看从库线程状态

  (2)flush tables with read lock;  :主从不一致后锁表。

    然后 show master status\G

    然后 show slave status\G 来查看从库同步状态 或者重新 change master to....

    然后 select master_pos_wait('mysql-bin.00002','389'); (即刚刚show master status找到的文件及位置),如果为1 标识超时退出 ,如果为1 则标识主从同步。

    最后再主库 unlock tables; 解锁

  (3)跳过错误

复制代码
跳过错误有两种方式:
1.跳过指定数量的事务:(建议如果已经出现了错误,使用这种办法)
mysql>slave stop;
mysql>SET GLOBAL SQL_SLAVE_SKIP_COUNTER = 1        #跳过一个事务
mysql>slave start

2.修改mysql的配置文件,通过slave_skip_errors参数来跳所有错误或指定类型的错误(建议配置时使用这种办法)
vi /etc/my.cnf
[mysqld]
#slave-skip-errors=1062,1053,1146 #跳过指定error no类型的错误,DDL错误类型包含 1007,1008,1050,1051,1054,1060,1061,1068,1091,1146(5.6可以用这个)
#slave-skip-errors=ddl_exist_errors #跳过DDL错误,all:跳过所有错误(mysql5.7才有ddl_exist_errors)
复制代码

   (4)大对象blog ,text 传输

   

【6】从库宕机如何重新连入主库?

1. 此2个参数rpl_semi_sync_master_enabled  和rpl_semi_sync_slave_enabled  不要直接写入到my.cnf配置文件开启。
2.在slave库上先 stop slave io_thread ;set global rpl_semi_sync_slave_enabled=0 关闭此参数。
然后start slave io_thread 或者start slave 开启异步复制,让slave库追赶上master库。
3.然后在slave库 set global rpl_semi_sync_slave_enabled=1 ;stop slave io_thread;start slave io_thread;

【7】参数探索

(7.1)rpl_semi_sync_master_wait_for_slave_count 与 rpl_semi_sync_master_wait_no_slave 参数的影响

本部分参考转自:https://www.cnblogs.com/konggg/p/12205505.html

【rpl_semi_sync_master_wait_for_slave_count】 ,

  1.master提交后所需的应答数量!如果slave clients数量大于等于这个值,那么master会一路畅行无阻;如果低于这个值,master可能会在事务提交阶段发生一次超时等待,当等待超过参数(rpl_semi_sync_master_timeout)设定时,master就转为异步模式(原理见下一个参数)。

  2.master将这个参数值作为标杆,用来和【Rpl_semi_sync_master_clients】参数做比较。

【rpl_semi_sync_master_wait_no_slave】

  1.为OFF时,只要master发现【Rpl_semi_sync_master_clients】小于【rpl_semi_sync_master_wait_for_slave_count】,则master立即转为异步模式。

  2.为ON时,空闲时间(无事务提交)里,即使master发现【Rpl_semi_sync_master_clients】小于【rpl_semi_sync_master_wait_for_slave_count】,也不会做任何调整。只要保证在事务超时之前,master收到大于等于

    rpl_semi_sync_master_wait_for_slave_count】值的ACK应答数量,master就一直保持在半同步模式;如果在事务提交阶段(master等待ACK)超时,master才会转为异步模式。

无论【rpl_semi_sync_master_wait_no_slave】为ON还是OFF,当slave上线到【rpl_semi_sync_master_wait_for_slave_count】值时,master都会自动由异步模式转为半同步模式。

 

粗略看来,设置为OFF时,master不会因为slave的离线而造成事务等待,这似乎是一个更合适的选择,但是为什么5.7中默认参数为ON呢?目前我还不得而知。

另外,本次实验建立在空闲场景(或者说极微小负载场景)下,在高并发的场景下,这个参数又会导致怎样的结果,这块也尚需后续探索。

 

【参考文档】

参考文章:

  mysql半同步复制 rpl_semi_sync_master_wait_no_slave 的探索https://www.cnblogs.com/konggg/p/12205505.html

  mysql复制实践:https://www.cnblogs.com/gered/p/11239898.html

  mysql复制日常维护,故障处理:https://www.cnblogs.com/gered/p/11388986.html

posted @ 2019-08-19 07:26  郭大侠1  阅读(645)  评论(0编辑  收藏  举报