MySQL 误操作时进行数据恢复
binlog2sql
binlog2sql 是一款用于解析 binlog 的工具,
可以从MySQL binlog解析出你要的SQL。
根据不同选项,你可以得到原始SQL、回滚SQL、去除主键的INSERT SQL等。
用途
- 数据快速回滚(闪回)
- 主从切换后新master丢数据的修复
- 从binlog生成标准SQL,带来的衍生功能
环境
- Python 2.7, 3.4+
- MySQL 5.6, 5.7
MySQL server必须设置以下参数:
[mysqld]
server_id = 1
log_bin = /var/log/mysql/mysql-bin.log
max_binlog_size = 1G
binlog_format = row
binlog_row_image = full
user需要的最小权限集合:
select, super/replication client, replication slave
建议授权
GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO
权限说明
- select:需要读取server端information_schema.COLUMNS表,获取表结构的元信息,拼接成可视化的sql语句
- super/replication client:两个权限都可以,需要执行'SHOW MASTER STATUS', 获取server端的binlog列表
- replication slave:通过BINLOG_DUMP协议获取binlog内容的权限
安装
# 安装git shell> yum install -y git
# 安装pip工具
shell> yum install -y epel-release shell> yum install -y python-pip # 安装binlog2sql shell> git clone https://github.com/danfengcao/binlog2sql.git && cd binlog2sql shell> pip install -r requirements.txt
基本用法
解析出标准SQL
shell> python binlog2sql.py -h127.0.0.1 -P3306 -uadmin -p'admin' -dtest -t test3 test4 --start-file='mysql-bin.000002' 输出: INSERT INTO `test`.`test3`(`addtime`, `data`, `id`) VALUES ('2016-12-10 13:03:38', 'english', 4); #start 570 end 736 UPDATE `test`.`test3` SET `addtime`='2016-12-10 12:00:00', `data`='中文', `id`=3 WHERE `addtime`='2016-12-10 13:03:22' AND `data`='中文' AND `id`=3 LIMIT 1; #start 763 end 954 DELETE FROM `test`.`test3` WHERE `addtime`='2016-12-10 13:03:38' AND `data`='english' AND `id`=4 LIMIT 1; #start 981 end 1147
解析出回滚SQL
shell> python binlog2sql.py --flashback -h127.0.0.1 -P3306 -uadmin -p'admin' -dtest -ttest3 --start-file='mysql-bin.000002' --start-position=763 --stop-position=1147 输出: INSERT INTO `test`.`test3`(`addtime`, `data`, `id`) VALUES ('2016-12-10 13:03:38', 'english', 4); #start 981 end 1147 UPDATE `test`.`test3` SET `addtime`='2016-12-10 13:03:22', `data`='中文', `id`=3 WHERE `addtime`='2016-12-10 12:00:00' AND `data`='中文' AND `id`=3 LIMIT 1; #start 763 end 954
选项
mysql连接配置
-h host; -P port; -u user; -p password
解析模式
--stop-never 持续解析binlog。可选。默认False,同步至执行命令时最新的binlog位置。
-K, --no-primary-key 对INSERT语句去除主键。可选。默认False
-B, --flashback 生成回滚SQL,可解析大文件,不受内存限制。可选。默认False。与stop-never或no-primary-key不能同时添加。
--back-interval -B模式下,每打印一千行回滚SQL,加一句SLEEP多少秒,如不想加SLEEP,请设为0。可选。默认1.0。
解析范围控制
--start-file 起始解析文件,只需文件名,无需全路径 。必须。
--start-position/--start-pos 起始解析位置。可选。默认为start-file的起始位置。
--stop-file/--end-file 终止解析文件。可选。默认为start-file同一个文件。若解析模式为stop-never,此选项失效。
--stop-position/--end-pos 终止解析位置。可选。默认为stop-file的最末位置;若解析模式为stop-never,此选项失效。
--start-datetime 起始解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。
--stop-datetime 终止解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。
对象过滤
-d, --databases 只解析目标db的sql,多个库用空格隔开,如-d db1 db2。可选。默认为空。
-t, --tables 只解析目标table的sql,多张表用空格隔开,如-t tbl1 tbl2。可选。默认为空。
--only-dml 只解析dml,忽略ddl。可选。默认False。
--sql-type 只解析指定类型,支持INSERT, UPDATE, DELETE。多个类型用空格隔开,如--sql-type INSERT DELETE。可选。默认为增删改都解析。用了此参数但没填任何类型,则三者都不解析。
实际案例
模拟删除部分数据后,需要紧急回滚
# 创建测试表 create table test1( `id` int(10) primary key AUTO_INCREMENT, `name` varchar(255) NOT NULL, `age` int DEFAULT 0, `created` datetime DEFAULT NULL )ENGINE=InnoDB DEFAULT CHARSET=utf8; # 插入3条数据 insert into test1(`name`, `age`, `created`) values('小明', 25, '2021-10-05 22:51:00'); insert into test1(`name`, `age`, `created`) values('小华', 29, '2021-10-05 22:52:00'); insert into test1(`name`, `age`, `created`) values('小陈', 20, '2021-10-05 22:53:00');
# 模拟删除部分数据
delete from test1 where id > 2;
开始回滚
# 找出日志
show master status;
# 解析出标准SQL,用于定位回滚的开始和结束位置 python binlog2sql.py -h127.0.0.1 -P3306 -uroot -p123456 -dtest_rollback -t test1 --sql-type DELETE --start-file='bin-log.000004'
虽然我指定了只解析DELETE语句,但还是把DDL给解析出来了
解析出回滚SQL
python binlog2sql.py -h127.0.0.1 -P3306 -uroot -p123456 --flashback -dtest_rollback -t test1 --sql-type DELETE --start-file='bin-log.000004'
# 解析出来的 SQL INSERT INTO `test_rollback`.`test1`(`id`, `name`, `age`, `created`) VALUES (3, '小陈', 20, '2021-10-05 22:53:00'); #start 1754 end 1967 time 2021-10-05 23:11:39
将上面解析出来的回滚SQL执行一遍即可
使用 binlog2sql 最大的好处就是解析出来的SQL语句非常直观,并且在注释中还包含了时间,这对于我们去查找故障发生点非常实用。想一想之前用过的mysqlbinlog工具,解析出来的结果中含有大量无关的信息,为我们排查问题增加了难度,而binlog2sql解析出来的SQL非常干净,便于我们排查问题,恢复数据。
其他案例:
参考链接:
https://www.cnblogs.com/lijiaman/p/12770397.html
https://github.com/danfengcao/binlog2sql
https://www.cnblogs.com/lijiaman/p/12770415.html