server_id
是必须设置在master和每个slave上的唯一标识ID,其取值范围 是1~4294967295之间,且同一个复制组之内不能重复
server_uuid:server_uuid会在GTID复制中使用。当MySQL启动之后,会 首先到数据文件目录下的auto.cnf中寻找是否有指定的server_uuid,如果没有找到,则自己生成一个server_uuid并保存到这个文件中
log_slave_updates
:该参数用来控制是否将收到的主库的更新数据的语句也记录在slave自己的bin log中。正常情况下是不需要记录的,但如果是想 创建级联复制关系,比如A -> B -> C,这其中B既要作为A的从库,也要作 为C的主库,则需要既开启log-bin参数,也要开启log_slave_updates参数
relay-log
:该参数用来指定relay-log文件的基础名称,默认的名称为 host_name-relay-bin.xxxx,其中的xxxx结尾是依次递增的数字
replicate-do-db
:该参数用来指定需要复制的数据库。 在基于语句复制的环境中,指定该参数之后,则slave的SQL thread进程只会应用在本数据库下的对象相关的语句。如果有多个数据库需要复制,则这 个参数要使用多次。但如果是涉及到跨库操作语句,则复制会丢失,比如: replicate-do-db=sales
USE prices;
UPDATE sales.january SET amount=amount+1000;
在基于行复制的环境中,只要数据库对象是指定的库,则复制都能正常,比如上述update语句由于january表是属于sales库的,则slave会复制并应用 ,同样下面的语句在基于行复制的环境中也不会执行:
USE sales;
UPDATE prices.march SET amount=amount-25;
在slave的my.cnf上设置replicate-do-db=test,重启mysql
在语句复制环境下查看对指定数据库的修改操作:
[mysqld]
binlog-format=statement
主库上执行:
mysql> use test;
mysql> update test2.temp set name='ddd';
mysql> use test2;
mysql> update test.temp set name='eee';
在从库上查看复制结果:
mysql> use test;
Reading table information for completion of table and column names
You can turn off this feature to get a quicker startup with -A
Database changed
mysql> select * from temp;
-- 虽然是指定的同步数据库但并没有同步
+------+------+
| id | name |
+------+------+
| 1|abc|
| 2|abc|
| 3|abc|
| 4|abc|
| 5|abc|
+------+------+
mysql> use test2;
mysql> select * from temp;
+------+------+
| id | name |
+------+------+
|10|ddd|
|11|ddd|
|12|ddd|
##虽然不是指定的同步数据库但数据有同步
在行复制环境下查看对指定数据库的修改操作:
mysql> show variables like '%binlog_format%';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| binlog_format | ROW |
+---------------+-------+
主库上执行:
mysql> use test;
mysql> update test2.temp set name='bcd';
mysql> use test2;
mysql> update test.temp set name='abc';
在从库上查看复制结果:
mysql> use test;
mysql> select * from temp; ##数据已复制
+------+------+
| id | name |
+------+------+
| 1|abc|
| 2|abc|
| 3|abc|
| 4|abc|
| 5|abc|
+------+------+
mysql> use test2;
mysql> select * from temp; ##数据未复制
+------+------+
| id | name |
+------+------+
| 10 | aa |
| 11 | bb |
| 12 | cc |
+------+------+
另一个基于SQL语句复制和基于行复制的区别在于当语句中包含对多个数据库的表进行 操作时。比如设置replicate-do-db=db1,
USE db1;
UPDATE db1.table1 SET col1 = 10, db2.table2 SET col2 = 20;
基于SQL语句的复制会将table1和table2都在备库修改,而基于行的复制只会在备库修改 table1表
USE db4;
UPDATE db1.table1 SET col1 = 10, db2.table2 SET col2 = 20;
而对于上述语句来说,基于SQL语句的复制不会在备库修改任何表,而基于行的复制会 在备库修改table1表 如果希望跨库的update语句在多个库上都起作用,可以使用replicate-do- table=db_name.tbl_name
replicate-ignore-db
:该参数决定了忽略指定数据库的复制,其行为和replicate-do-db 正好相反
replicate-do-table=db_name.tbl_name
:通过该参数告知slave的SQL thread仅复制指 定表上的数据。如果有多个表,则该参数要使用多次
replicate-ignore-table=db_name.tbl_name
:通过该参数告知slave的SQL thread将指 定表上的数据过滤掉
replicate-wild-do-table=db_name.tbl_name
:通过该参数告知SQL的SQL thread仅复 制符合匹配的表,可以使用_和%作为通配符。比如replicate-wild-do- table=foo%.bar%表示复制以foo打头的数据库下所有bar打头的表数据。如果是 replicate-wild-do-table=foo%.%,则表示即复制foo打头的所有表的数据,也复制 create/drop/alter database foo打头的命令
replicate-wild-ignore-table=db_name.tbl_name
:通过该参数告知SQL的SQL thread 过滤掉符合匹配的表
设置replicate-do-table参数,重启mysql:
[mysqld]
replicate-do-db=test
replicate-do-table=test.temp
slave-parallel-workers
: 该参数决定了slave上启动多个SQL thread线程来并行应用数据的。默认值是0代表不允许并行,取值范围可以是0~1024
[mysqld] slave-parallel-workers=5
skip-slave-start
:该参数决定了在MySQL启动时是否先不启动slave线程,即暂停复 制
[mysqld]
skip-slave-start=1
slave-parallel-type=type
:该参数决定了当启动了并行之后,采用什么粒度的并行方 式。默认值database表示按照不同的数据库执行并行,LOGICAL_CLOCK则表示按照 在binlog中的一组提交的事务作为并行粒度
slave-skip-errors
=[err_code1,err_code2,...|all|ddl_exist_errors]:该参数决定了当slave的SQL thread执行过程中碰到何种错误时可以忽略并继续接下来的数据复制。正常情况下当有错误发生时,复制会停止而需要人工干预修复才能继续进行。除非非常自信可以忽略某些错误,否则不要使用这个参数,不然会导致虽然复制执行正常,但其实内部的数据已经完全不一致
sql_slave_skip_counter
代表在非GTID复制环境下,通过设置此参数来跳过多少个复制事件。 设置完该参数并非立即生效,而是要等待下次start slave命令的执行生效,并将该参数再次设 置为0
log-bin[=base_name]
:该参数表示是否开启binary log。默认情况下MySQL会使用 host_name-bin.xxxx作为文件的名字,其中xxxx是以数字递增的后缀。如果该参数指定了 base_name,则二进制文件会以base_name.xxxx来命名
binlog-do-db=db_name
: 该参数决定了哪些库下的修改会被记录到bin log中。其行为与 replicate-do-db类型,在基于SQL语句复制的环境下,只记录在当前数据库下的修改。比如指 定binlog-do-db=sales,一下语句不会被记录到bin log中:
USE prices;
UPDATE sales.january SET amount=amount+1000;
而以下语句则会被记录到bin log中:
USE sales; UPDATE prices.discounts SET percentage = percentage + 10;
而基于行复制的环境下,只有属于指定数据的语句才会被记录到bin log中。比如下面的语句会被记录:
USE prices;
UPDATE sales.february SET amount=amount+100;
-- 而下面的语句则不会被记录:
USE sales;
UPDATE prices.march SET amount=amount-25;
-- 针对跨库的语句来说,行为和replicate-do-db相同
binlog-ignore-db=db_name
:该参数决定了在bin log中忽略的数据库,其行为与 replicate-ignore-db类型
binlog_format
:该参数决定了bin log中记录的格式,可以是statement,row,mixed,分别 代表基于SQL语句的复制,基于行复制和基于混合复制。在5.7.7版本之前的默认设置是 statement,在5.7.7及以后,则默认是row。当设置为混合模式时,则优先使用statement, 只有当基于语句的复制无法保证复制的准确时会自动替换为row
检查复制状态方法
SHOW SLAVE STATUS\G
Slave_IO_State: -- 代表当前slave的状态
Slave_IO_Running: -- 代表负责读取主库bin log的IO线程是否是运行状态,正常情况下应 该是YES
Slave_SQL_Running: -- 代表负责执行备库relay log的SQL线程是否是运行状态,正常情 况下应该是YES
Last_IO_Error, Last_SQL_Error: -- 分别代表最后一次IO线程和SQL线程所发生的错误, 正常情况下应该是空代表没有错误
Seconds_Behind_Master: -- 代表备库的SQL线程比主库的bin log晚多少秒。0代表目前 没有复制延迟
(Master_Log_file, Read_Master_Log_Pos): -- 表示IO线程在主库bin log中的坐标位置
(Relay_Master_Log_File, Exec_Master_Log_Pos): -- 表示SQL线程在主库bin log中的坐 标位置
(Relay_Log_File, Relay_Log_Pos): -- 表示SQL线程在备库relay log中的坐标位置
在主库可以通过执行show processlist命令查看主库的bin log日志生成进程
mysql> SHOW PROCESSLIST \G;
*************************** 4. row ***************************
Id: 10
User: root
Host: slave1:58371
db: NULL
Command: Binlog Dump
Time: 777
State: Has sent all binlog to slave; waiting for binlog to be updated
Info: NULL