Mysql 主从复制与读写分离
一、案例概述
- 在实质际的生产环境中,对数据库的读和写都在同一个数据库服务器中,是不能满足实院需求的。
- 无论是在安全性、高可用性还是高并发等各个方面都是完全不能满足实际需求的。
- 因此,通过主从复制的方式来同步数据,再通过读写分离来提升数据库的并发负载能力。有点类似于rsync,但是不同的是rsync是对磁盘文件做备份,而mysql主从复制是对数据库中的数据、语句做备份。
二、Mysql 主从复制原理
Mysql 的主从复制和 MySQL 的读写分离两者联系紧密,先要部署主从复制,然后在此基础上进行数据的读写分离。
1、MySQL 支持的复制类型
- 基于语句的复制(STATEMENT)。在主服务器上执行的 SQL 语句,在从服务器上执行同样的语句。MySQL 默认采用基于语句的复制,效率比较高。
- 基于行的复制(ROW)。把改变的内容复制过去,而不是把命令在从服务器上执行一遍。
- 混合类型的复制(MIXED)。默认采用基于语句的复制,一旦发现基于语句无法精确复制时,就会采用基于行的复制。
2、MySQL主从复制的工作过程
3、MySQL支持的复制类型
(1)STATEMENT∶基于语句的复制。在服务器上执行SQL语句,在从服务器上执行同样的语句,mysgl默认采用基于语句的复制,执行效率高。
#虽然效率较高但是高并发情况下可能精确度不够
(2)ROW∶基于行的复制。把改变的内容复制过去,而不是把命令在从服务器上执行一遍
#虽然拥有很高的精确度,但是读写效率较低
(3)MIXED∶混合类型的复制。默认采用基于语句的复制,一旦发现基于语句无法精确复制时,就会采用基于行的复制
#结合前两种类型的优点,比较实用
4、主从复制的工作原理
(1)Master节点将数据的改变记录成二进制日志(Binary log),当Master上的数据发生改变时,则将其改变写入二进制日志中。
(2)Slave节点会在一定时间间隔内对Master的二进制日志进行探测其是否发生改变,如果发生改变,则开始一个I/O线程请求Master的二进制事件。
(3)同时Master节点为每个I/O线程启动一个dump线程,用于向其发送二进制事件,并保存至Slave节点本地的中继日志(Relay log)中,Slave节点将启动SQL线程从中继日志中读取二进制日志,在本地重放,即解析成sql语句逐一执行,使得其数据和Master节点的保持一致,最后I/O线程和SQL线程将进入睡眠状态,等待下一次被唤醒。
也就是说:
- 在每个事务更新数据完成之前,Master在二进制日志(Binary log)记录这些改变。写入二进制日志完成后,Master通知存储引擎提交事务。
- Slave将Master复制到其中继日志(Relay log) 。首先slave开始一个工作线程(I/O),I/0线程在Master上打开一个普通的连接,然后开始Binlog dump process。Binlog dump process 从Master的二进制日志中读取事件,如果已经跟上 Master ,它会睡眠并等待Master产生新的事件,I/O线程将这些事件写入中继日志(缓存中)。
- SQL slave thread (SQL从线程)处理该过程的最后一步,SQL线程从中继日志读取事件,并重放其中的事件而更新 Slave 数据,使其与Master 中的数据一致,只要该线程与I/O 线程保持一致,执行结束后I/O线程和SQL线程都会进行睡眠状态等待下一次操作的执行
注:
中继日志通常位于OS缓存中,所以中继日志的开销很小。
复制过程有一个很重要的限制,即复制在Slave上是串行化的,也就是说Master上的并行更新操作不能在Slave上并行操作。
5、MySQL主从复制延迟及解决思路
(1)master服务器高并发,形成大量事务
(2)网络波动,延迟
(3)主从硬件设备差异过大导致(如cpu主频、内存io、硬盘io)
(4)本来就不是同步复制、而是异步复制
解决方案:
(1)从库优化Mysql参数。比如增大Innodb_buffer_pool_size,该参数定义了InnoDB存储引擎的表数据和索引数据的最大内存缓冲区大小,让更多操作在Mysql内存中完成,减少磁盘操作。
(2)从库使用高性能主机。包括cpu强悍、内存加大。避免使用虚拟云主机,使用物理主机,这样提升了i/o方面性。
(3)从库使用SSD磁盘(固态硬盘)
(4)网络优化,避免跨机房实现同步(减小网络延迟)
三、MySQL 读写分离原理
1、什么是读写分离
基本的原理就是让主数据库处理事务性增、改、删操作(TNSEBT、UPDATE、DELETE),而从数据库处理SELECT查询操作。数据库复制被用来把事务性操作导致的变更同步到集群中的从数据库。
2、为什么要读写分离
因为数据库的"写"(写10000条数据可能要3分钟)操作是比较耗时的。
但是数据库的"读" (读10000条数据可能只要5秒钟)
所以读写分离,解决的是,数据库的写入,景响了查询的效率。
3、什么时候要读写分离
数据库不一定要读写分离,如果程序使用数据库较多时,而更新少,查询多的情况下会考虑使用。利用数据库主从同步,再通过读写分离可以分担数据库压力,提高性能。
4、读写分离的原理
读写分离基本的原理是让主数据库处理事务性增、改、删操作(INSERT、UPDATE、DELETE),而从数据库处理SELECT香询操作。数据库复制被用来把事务性操作导致的变更同步到集群中的从数据库。
5、常见的 MySQL 读写分离分为两种
1)基于程序代码内部实现
在代码中根据select、insert进行路由分类,这类方法也是目前生产环境应用最广泛的。
优点是性能较好,因为在程序代码中实现,不需要增加额外的设备为硬件开支; 缺点是需要开发人员来实现,运维人员无从下手。
但是并不是所有的应用都适合在程序代码中实现读写分离,像一些大型复杂的Java应用,如果在程序代码中实现读写分离对代码改动就较大。
2)基于中间代理层实现
代理一般位于客户端和服务器之间,代理服务器接到客户端请求后通过判断后转发到后端数据库,有以下代表性程序。
(1)MySQL-Proxy:MySQL-Proxy为MySQL开源项目,通过其自带的lua脚本进行SQL判断。
(2)Atlas:是由奇虎360的Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项目。它是在mysql-proxy0.8.2版本的基础上,对其进行了优化,增加了一些新的功能特性。360内部使用Atlas运行的mysgl业务,每天承载的读写请求数达几十亿条。支持事物以及存储过程。
(3)Amoeba:由陈思儒开发,作者曾就职于阿里巴巴。该程序由Java语言进行开发,阿里巴巴将其用于生产环境。但是它不支持事务和存储过程。
由于使用MySQL Proxy需要写大量的Lua脚本,这些Lua并不是现成的,而是需要自己去写。这对于并不熟悉MySQL Proxy内置变量和MySQL Protocol 的人来说是非常困难的。
Amoeba是一个非常容易使用、可移植性非常强的软件。因此它在生产环境中被广泛应用于数据库的代理层。
四、Mysql 主从复制和读写分离实验部署
实验拓扑图:
实验思路:
1、客户端访问代理服务器
2、代理服务器写入到主服务器
3、主服务器将增删改写入自己二进制日志
4、从服务器将主服务器的二进制日志同步至自己中继日志
5、从服务器重放中继日志到数据库中
6、客户端读,则代理服务器直接访问从服务器
7、降低负载,起到负载均衡作用
环境准备:
Shell脚本一键部署-----源码编译安装MySQL数据库
主机 | 操作系统 | IP地址 | 所需工具/软件包 |
Master | Centos7 | 20.0.0.5 | ntp 、 mysql-boost-5.7.20.tar.gz |
Slave1 | Centos7 | 20.0.0.6 | ntp 、ntpdate 、 mysql-boost-5.7.20.tar.gz |
Slave2 | Centos7 | 20.0.0.7 | ntp 、ntpdate 、 mysql-boost-5.7.20.tar.gz |
Amoeba | Centos7 | 20.0.0.8 | jdk-6u14-linux-x64.bin、amoeba-mysql-binary-2.2.0.tar.gz |
客户端 | Centos7 | 20.0.0.9 | - |
systemctl stop firewalld setenforce 0 systemctl disable firewalld
一、搭建 Mysql 主从复制
1、Mysql 主从服务器时间同步
主服务器设置(20.0.0.5)
yum -y install ntp
vim /etc/ntp.conf
末尾添加
server 127.127.0.0 #设置本地是时钟源,注意修改网段 fudge 127.127.0.0 stratum 8 #设置时间层级为8(限制在15内) service ntpd start
从服务器设置(20.0.0.6)、(20.0.0.7)
yum -y install ntp ntpdate service ntpd start /usr/sbin/ntpdate 20.0.0.5 #进行时间同步,指向Master服务器IP crontab -e */30 * * * * /usr/sbin/ntpdate 20.0.0.5
2、主服务器的mysql配置
vim /etc/my.cnf server-id = 1 log-bin=master-bin #添加,主服务器开启二进制日志
binlog_format=MIXED #二进制格式,混合模式 log-slave-updates=true #添加,允许从服务器更新二进制日志 systemctl restart mysqld mysql -u root -p GRANT REPLICATION SLAVE ON *.* TO 'myslave'@'20.0.0.%' IDENTIFIED BY '123456'; #给从服务器授权 FLUSH PRIVILEGES; show master status; #File 列显示日志名,Position 列显示偏移量
3、从服务器的 mysql 配置
(slave1:20.0.0.6 slave2:20.0.0.7)两个从节点配置一样
vim /etc/my.cnf server-id = 2 #修改,注意id与Master的不同,两个Slave的id也要不同 relay-log=relay-log-bin #添加,开启中继日志,从主服务器上同步日志文件记录到本地 relay-log-index=slave-relay-bin.index #添加,定义中继日志文件的位置和名称 systemctl restart mysqld mysql -u root -p change master to master_host='20.0.0.5' , master_user='myslave',master_password='123456',master_log_file='master-bin.000001',master_log_pos=751; #配置同步,注意 master_log_file 和 master_log_pos 的值要与Master查询的一致,这里的是例子,每个人的都不一样 start slave; #启动同步,如有报错执行 reset slave; show slave status\G #查看 Slave 状态 //确保 IO 和 SQL 线程都是 Yes,代表同步正常。 Slave_IO_Running: Yes #负责与主机的io通信 Slave_SQL_Running: Yes #负责自己的slave mysql进程
#一般 Slave_IO_Running: No 的可能性:
1、网络不通
2、my.cnf配置有问题
3、密码、file文件名、pos偏移量不对
4、防火墙没有关闭
4、验证主从复制效果
主服务器上进入执行 create database db_test;
create database db_test; show databases; +--------------------+ | Database | +--------------------+ | information_schema | | db_test | | mysql | | performance_schema | | sys | +--------------------+
从服务器上查看
show databases;
二、搭建 MySQL 读写分离
Amoeba(192.168.184.20)
1、安装 Java 环境
因为 Amoeba 基于是 jdk1.5 开发的,所以官方推荐使用 jdk1.5 或 1.6 版本,高版本不建议使用。 将jdk-6u14-linux-x64.bin 和 amoeba-mysql-binary-2.2.0.tar.gz.0 上传到/opt目录下。 cd /opt/ cp jdk-6u14-linux-x64.bin /usr/local/ cd /usr/local/ chmod +x jdk-6u14-linux-x64.bin ./jdk-6u14-linux-x64.bin 按空格到最后一行 按yes,按enter mv jdk1.6.0_14/ /usr/local/jdk1.6 vim /etc/profile export JAVA_HOME=/usr/local/jdk1.6 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib export PATH=$JAVA_HOME/lib:$JAVA_HOME/jre/bin/:$PATH:$HOME/bin export AMOEBA_HOME=/usr/local/amoeba export PATH=$PATH:$AMOEBA_HOME/bin source /etc/profile java -version
##安装 Amoeba软件## mkdir /usr/local/amoeba tar zxvf /opt/amoeba-mysql-binary-2.2.0.tar.gz -C /usr/local/amoeba/ chmod -R 755 /usr/local/amoeba/ /usr/local/amoeba/bin/amoeba //如显示amoeba start|stop 说明安装成功
2、配置 Amoeba读写分离,两个 Slave 读负载均衡
(1)先在Master、Slave1、Slave2 的mysql上开放权限给 Amoeba 访问
grant all on *.* to test@'20.0.0.%' identified by 'xxx.com';
Master (20.0.0.5)
Slave1(20.0.0.6)、Slave2(20.0.0.7)
(2)amoeba服务器配置amoeba服务
---30修改---
<property name="user">amoeba</property>
---32行---
<property name="password">123456</property>
---115修改---
<property name="defaultPool">master</property>
---117去掉注释并修改---
<property name="writePool">master</property> <property name="readPool">slaves</property>
cp dbServers.xml dbServers.xml.bak
vim dbServers.xml #修改数据库配置文件
---23注释掉--- #作用:默认进入test库 以防mysql中没有test库时,会报错
<!-- mysql schema <property name="schema">test</property> -->
---26修改---
<!-- mysql user --> <property name="user">test</property>
---28-30去掉注释---
<property name="password">123.com</property>
---45修改--- #设置主服务器的名Master
<dbServer name="master" parent="abstractServer">
---48修改--- #设置主服务器的地址
<property name="ipAddress">20.0.0.5</property>
---52修改--- #设置从服务器的名slave1
<dbServer name="slave1" parent="abstractServer">
---55修改--- #设置从服务器1的地址
<property name="ipAddress">20.0.0.6</property>
---58复制上面6行粘贴--- #设置从服务器2的名slave2和地址
<dbServer name="slave2" parent="abstractServer"> <property name="ipAddress">20.0.0.7</property>
---65修改---
<dbServer name="slaves" virtual="true">
---71修改---
<property name="poolNames">slave1,slave2</property>
/usr/local/amoeba/bin/amoeba start& #启动Amoeba软件,按ctrl+c 返回 netstat -anpt | grep java #查看8066端口是否开启,默认端口为TCP 8066
3、测试读写分离
(1)在客户端服务器上进行测试
yum install -y mysql mysql-server #使用yum快速安装MySQL虚拟客户端 mysql -u amoeba -p123456 -h 20.0.0.8 -P8066
通过amoeba服务器代理访问mysql ,在通过客户端连接mysql后写入的数据只有主服务器会记录,然后同步给从服务器
主服务器上 (20.0.0.5)
use db_test; create table test (id int(10),name varchar(10),address varchar(20));
两台从服务器上 slave1(20.0.0.6),slave2(20.0.0.7)
stop slave; #关闭同步
use db_test;
在slave1上
insert into test values('1','aaa','this is slave1');
在slave2上
insert into test values('2','bbb','this is slave2');
在master 上
insert into test values('3','MMM','this is master');
在客户端服务器上(20.0.0.9)
use db_test; select * from test; //客户端会分别向slave1和slave2读取数据,显示的只有在两个从服务器上添加的数据,没有在主服务器上添加的数据 insert into test values('4','DDD','this is client'); //只有主服务器上有此数据
再在两个从服务器上执行 start slave; 即可实现同步在主服务器上添加的数据