Percona XtraBackup 实现全备&增量备份与恢复【转】

percona-xtrabackup主要是有两个工具，其中一个是xtrabackup，一个是innobackupex，后者是前者封装后的一个脚本。
在针对MySQL的物理备份工具中，大概是最流行也是最强大的工具了，此外著名的物理备份工具还有官方的mysqlbackup。
xtrabackup只可备份事务表，不能用于备份非事务表，而innobackupex不仅可用于备份事务表，也可以备份非事务表如MyISAM
此文主要介绍innobakcupex的使用和原理。

本文所用到的版本：
xtrabackup 2.3.7 + MySQL 5.6.30

若MySQL版本为5.7.x，建议使用xtrabackup 2.4.x

〇 xtrabackup可以做的
对InnoDB引擎的表做热备
增量备份
流压缩传输到另外的服务器上
在线移动表
更简单的创建从库
备份时不增加服务器负载

〇原理
备份及恢复大致涉及三个步骤：备份 -> prepare -> 恢复
备份运行时，工具会记住当时的LSN号，并打开xtrabackup_logfile，然后开始对datafile进行copy，即ibdata1及ibd文件。
复制需要一定的时间，在复制期间，如果文件被修改，工具将监视redo log file并将每一次更变记录下来，保存在xtrabackup_logfile中。
接下来处理非事务表如MyISAM的备份操作，innobackupex通过FLUSH TABLES WITH READ LOCK来阻塞DML。
并在此时获取binlog的position[和GTID]（此处我理解为和mysqldump --single-transaction处理方式类似）
在做完非事务表的copy之后，执行UNLOCK TABLES，完成备份，并停止记录xtrabackup_logfile。
接下来就是需要做prepare的过程，该过程类似InnoDB的crash-recovery。
对redo log进行前滚（到数据文件），并将没提交的事务进行回滚操作（rollback），这样便可以保证数据的一致性，所以对于事务表，整个过程是不会影响写操作的。

注：InnoDB、XtraDB、MyISAM是肯定支持的，其他的存储引擎不确定，待测。

〇权限需求
操作系统：
对datadir需要有rwx的权限。
MySQL：
最小所需要的权限有：
RELOAD
LOCK TABLES（如果加上--no-lock的话可以不要）
REPLICATION CLIENT（为了获得binary log的position）
PROCESS（为了执行show engine innodb status，并且需要查看所有运行的线程）
其他可能需要用到的权限：
CREATE TABLESPACE（如果需要通过5.6+ 的TTS恢复/迁移单个表的话）
SUPER（可能需要在复制环境里启动或者停止slave线程）
CREATE\INSERT\SELECT（对PERCONA_SCHEMA.xtrabackup_history进行操作）

〇安装
安装超简单（只能在linux上用，不过但这就够了）
https://www.percona.com/downloads/XtraBackup/LATEST/
戳进去选择版本down下来很容易就可以用了。
有RPM包、DEB包、源码包、二进制包。
个人推荐使用二进制包，解压，配置环境变量即可使用，在debian系或RHEL系通用，方便的一比。
源码包的安装，可以参考我这篇博文：
http://blog.itpub.net/29773961/viewspace-1853405/

〇配置
默认读取my.cnf的选项，读取优先级与MySQL相同。
比如在备份和恢复的时候无需指定datadir等，因为可以读取[mysqld]组下的选项。
同样也可以读取[client]的信息，比如可以将socket，user，password加载到（虽然因为安全因素不建议使用，但是可以这么做）。
当然也可以通过innobackupex --defaults-file=xxxx/my.cnf 去指定将要读取的配置文件。

〇全备
① 备份：
若加上--no-timestamp，则不会在所指定的目录里生成一个时间戳目录，而是直接放在所指定的目录里，我一般是加的：
innobackupex --user= --password= $basedir [--no-timestamp]（当然--user/--password可以直接写作 -u $username -p $password）

在备份的文件夹中，有几个文件值得注意：
xtrabackup_binlog_info记录了binlog的position，若开启了GTID，也会将GTID取出。
在用于备份+binlog恢复或建立slave的场景里十分有用。
xtrabackup_checkpoints记录了此次备份的类型和lsn号的起始值，是否压缩等
xtrabackup_info则记录了备份工具的信息，时间，备份对象（是针对全实例还是某库表），是否是增量，binlog位置等

     # cat xtrabackup_binlog_info
     binlog.000001 2321 931d11a2-9a8b-11e6-829f-000c298e914c:1-8

     # cat xtrabackup_checkpoints
     backup_type = full-backuped
     from_lsn = 0
     to_lsn = 304247338
     last_lsn = 304247338
     compact = 0
      recover_binlog_info = 0

     # cat xtrabackup_info
     uuid = cfb49b5f-02e8-11e7-94b4-000c298e914c
     name =
     tool_name = innobackupex
     tool_command = --password=... /data/dbbak
     tool_version = 2.3.7
     ibbackup_version = 2.3.7
     server_version = 5.6.30-log
     start_time = 2017-03-07 11:47:36
     end_time = 2017-03-07 11:47:39
     lock_time = 0
     binlog_pos = filename 'binlog.000001', position '2321', GTID of the last change '931d11a2-9a8b-11e6-829f-000c298e914c:1-8'
     innodb_from_lsn = 0
     innodb_to_lsn = 304247338
     partial = N
     incremental = N
     format = file
     compact = N
     compressed = N
     encrypted = N

还有一个backup-my.cnf文件，则记录了备份时可能涉及到的选项参数，比如系统表空间信息，独立undo表空间信息，redo-log信息等：
     # cat backup-my.cnf
     # This MySQL options file was generated by innobackupex.

     # The MySQL server
     [mysqld]
     innodb_checksum_algorithm=innodb
     innodb_log_checksum_algorithm=innodb
     innodb_data_file_path=ibdata1:12M:autoextend
     innodb_log_files_in_group=2
     innodb_log_file_size=50331648
     innodb_fast_checksum=false
     innodb_page_size=16384
     innodb_log_block_size=512
     innodb_undo_directory=.
     innodb_undo_tablespaces=0

② prepare：
第二步就是prepare，前文也提到，这个过程类似innodb的crash recovery
也可以理解为是“apply”的过程，这里是全备prepare的命令，十分简单
innobackupex --apply-log $basedir
在--apply-log的时候，可以指定--use-memory，增大其值加快速度，若不指定，默认值为100MB。

③ 恢复到datadir：
恢复过程也十分简单（全备和增备都是这一个恢复命令），只需要加上--copy-back参数即可
innobackupex --copy-back $basedir
这样就可以将$basedir的东西恢复到datadir下了，datadir无需指定，将会读取my.cnf获得
默认是需要datadir内为空的（或者没有创建），如果要强制写，则需要加参数： --force-non-empty-directories

〇增备

增量备份比起全备要复杂一点，本文也想主要介绍如何做增量备份。
用于有的场景，可能不需要每天对数据做全备。
比如有的场景是，每周做一次全备，每天对做一次增量备份，可以节约磁盘空间也可以减少备份时间。
增备的原理是通过对比LSN的信息，来找到被更变的数据，当有了修改操作时，LSN号会改变，和上一次全备的差异LSN号做对比，则可将差异数据备份出来。

整个过程还是分为三个步骤，备份 -> prepare -> 恢复

①增备方法与全备不一样：
innobackupex --user= --password= --incremental $new_dir --incremental-basedir=$basedir

其中--incremental是本次增量备份存放目录
$new_dir是表示将增量备份出来的东西放在哪个目录
--incremental-basedir则表示，针对哪一次备份做增量备份

备份的差异在目录的xtrabackup_checkpoints中查看：
比如：
$basedir中内容：
     backup_type = full-prepared
     from_lsn = 0
     to_lsn = 304247338
     last_lsn = 304247338
     compact = 0
     recover_binlog_info = 0

$new_bkdir中内容：
     backup_type = incremental
     from_lsn = 304247338
     to_lsn = 304250267
     last_lsn = 304250267
     compact = 0
     recover_binlog_info = 0

可以注意一下增备的from_lsn号
大于这个LSN号的页都是被变更过的，这些偏移量，也就是需要被增量备份出去的

②prepare：
prepare过程：
从第一个备份开始（也就是全量）做prepare，再将往后的增量备份依次添加到全量备份中。
注意，此处多了一个参数即--redo-only，该参数是指将已提交的事务应用，未提交的事务回滚。
此外，--incremental-dir也是在之前没有用到过的，这个参数代表需要被合并进去的增量备份目录。
注意，此处多次的增量备份是指：针对上次的增量备份做的增量。

也就是可以理解为：
全备：500GB
第一次增量备份：2GB
第二次增量备份：1GB（针对第一次增量备份的增量数据）
……
第n次

按照备份顺序做prepare，也就是prepare的顺序为：
第一次全备 -> 增量备份1 -> 增量备份2 -> ... -> 增量备份n
第一次全备的prepare：innobackup --apply-log --redo-only $basedir
第二次prepare：innobackup --apply-log --redo-only $basedir --incremental-dir=$new_dir_1（此处的$new_dir_1也就是第一次增量备份）
......
第n次prepare：innobackup --apply-log $basedir --incremental-dir=$new_dir_n（此处的$new_dir_n也就是最近也就是最后一次的增量备份
最后一次增量备份的prepare，不需要指定--redo-only

最后将增量备份和全备进行合并，将未提交的事务回滚，这个操作和全量prepare无异：
innobackup --apply-log $basedir

看起来有点复杂，但没关系，下面会有实验和图解。

③恢复到datadir：
和全量无异，直接copyback就行了
innobackupex --copy-back $basedir

增量备份的prepare有点蛋疼，还是小结一下：
      ① prepare完备（加上--redo-only）
      ② prepare每一次增量备份到完备中，需要加上--redo-only，最后一次增量备份的prepare不需要加--redo-only
      ③ 对生成的最终完备做--apply-log

〇实验

接下来就是实验……
先建个备份用的用户，给个权限。

mysql> CREATE USER xbackup@localhost IDENTIFIED BY 'back123';

mysql> GRANT RELOAD, PROCESS, LOCK TABLES, REPLICATION CLIENT ON *.* TO xbackup@localhost;

〇完全备份&恢复
在test.tb里加入测试数据

mysql> CREATE TABLE test.tb(id int primary key, name varchar());

Query OK,  rows affected (0.07 sec)

mysql> INSERT INTO test.tb VALUES(,'zhou'),(,''),(,'YYF'),(,'ChuaN'),(,'Faith');

Query OK,  rows affected (0.02 sec)

Records:  Duplicates:  Warnings:

创建备份存放目录
$ mkdir -p /data/backup/

指定备份存放位置，开始备份
$ innobackupex -uxbackup -pbackup123 --no-timestamp /data/backup/backup
此处的/data/backup/backup就是全备的目录了。

…………（省略刷屏输出）
xtrabackup: Transaction log of lsn (304289583) to (304290858) was copied.
170321 16:06:11 completed OK!

看到completed OK，表明就真的ok了。

可以看一下这个目录中的内容：
一部分是MySQL下datadir的内容，如库目录，redolog，系统表空间。
一部分是之前也有介绍过的，由备份工具生成的东西：
backup-my.cnf
ibdata1
ib_logfile0
ib_logfile1
mysql
performance_schema
test
xtrabackup_binlog_info
xtrabackup_binlog_pos_innodb
xtrabackup_checkpoints
xtrabackup_info
xtrabackup_logfile

进行prepare

$ innobackupex --apply-log /data/backup/backup

关闭mysqld
$ mysqladmin -uroot -p shutdown
Enter password:
$ ps -ef|grep mysql
root 2991 2438 1 11:08 pts/0 00:00:00 grep mysql

移除datadir：
$ mv /data/mysql_data /data/mysql_data.bk

恢复数据
$ innobackupex --copy-back /data/backup/backup/

修改新datadir的权限
$ chown mysql:mysql -R /data/mysql_data

启动数据库
$ mysqld &
$ ps -ef|grep mysql
root 2712 2438 86 16:35 pts/0 00:00:02 mysqld
root 2714 2438 0 16:35 pts/0 00:00:00 grep mysql

检查test.tb中的内容

$ mysql -e "SELECT * FROM test.tb;"

+----+-------+

| id | name  |

+----+-------+

|   | zhou  |

|   |    |

|   | YYF   |

|   | ChuaN |

|   | Faith |

+----+-------+

至此，完全备份&恢复完成

〇增量备份&恢复

先来一次全备：
$ innobackupex -uxbackup -pbackup123 --no-timestamp /data/backup/all_backup
修改测试表及数据：（加个字段，改两条数据）

mysql> ALTER TABLE test.tb ADD COLUMN picked varchar();

Query OK,  rows affected (0.06 sec)

Records:  Duplicates:  Warnings:

mysql> UPDATE test.tb SET picked='naga' WHERE id=;

Query OK,  row affected (0.04 sec)

Rows matched:  Changed:  Warnings: 

mysql> UPDATE test.tb SET picked='TA' WHERE id=;

Query OK,  row affected (0.00 sec)

Rows matched:  Changed:  Warnings:

执行第一次增量备份：
$ innobackupex -uxbackup -pbackup123 --no-timestamp --incremental /data/backup/incremental-dir-1 --incremental-basedir=/data/backup/all_backup/

可以再做一次增量备份：
此时有两种增量备份方法：
第一种，总是针对basedir做增量，这个方式恢复起来就特别简单了，只需要将最后一次的增量备份合并到全量备份里，就可以恢复了。
第二种，总是针对上一次的增量，做增量备份。这个方式的恢复，就要逐一合并了，也就是我上述所说看起来有点复杂的增备思路。
反正我是喜欢第一种的，感觉也可以适应绝大多数场景。

我拿word涂了两张图，帮助理解。
第一种：
总是将1月1日的全备作为basedir，所以FROM_LSN号总是5000。

第二种：
总是把上一次（最近一次）的备份作为basedir。

此处介绍第二种：
多次增量备份的方法依旧，只需要修改--incremental-basedir即可：

继续对test.tb做一些修改：

mysql> UPDATE test.tb SET picked='DS' WHERE id=;

Query OK,  row affected (0.04 sec)

Rows matched:  Changed:  Warnings:

mysql> SELECT * FROM test.tb;

+----+-------+--------+

| id | name  | picked |

+----+-------+--------+

|   | zhou  | naga   |

|   |    | TA     |

|   | YYF   | DS     |

|   | ChuaN | NULL    |

|   | Faith | NULL    |

+----+-------+--------+

 rows in set (0.01 sec)

针对第一次增量备份/data/backup/incremental-dir-1，做第二次增量备份，将第二次的增量备份放到/data/backup/incremental-dir-2/

$ innobackupex -uxbackup -pbackup123 --no-timestamp --incremental /data/backup/incremental-dir-2/ --incremental-basedir=/data/backup/incremental-dir-1

prepare过程，这个也是增量备份里最蛋疼的过程：

因为总共做了三次备份，所以先做三次prepare：
先对全备做prepare：
$ innobackupex --apply-log --redo-only /data/backup/all_backup/
然后接下来做第一次增量备份的prepare：
$ innobackupex --apply-log --redo-only /data/backup/all_backup/ --incremental-dir=/data/backup/incremental-dir-1
再对第二次的增量备份prepare，注意，第二次的增备是最后一次，所以不需要加上--redo-only参数：
$ innobackupex --apply-log /data/backup/all_backup/ --incremental-dir=/data/backup/incremental-dir-2

最后将两次增量备份和全备做一次合并：
$ innobackupex --apply-log /data/backup/all_backup/

恢复过程，这个和全量恢复没有区别：

停掉mysqld
$ mysqladmin -uroot -p shutdown
$ ps -ef|grep mysql
root 3533 3081 0 17:05 pts/1 00:00:00 grep mysql

移除datadir
$ mv /data/mysql_data /data/mysql_data.bk2

恢复数据
$ innobackupex --copy-back /data/backup/all_backup/

修改新datadir的权限
$ chown mysql:mysql -R /data/mysql_data

启动
$ mysqld &

检查一下，全备和两次增备的内容都已经被恢复回来了，也就是最后一次数据的状态：

$ mysql -uroot -p -e "SELECT * FROM test.tb;"

+----+-------+--------+

| id | name  | picked |

+----+-------+--------+

|   | zhou  | naga   |

|   |    | TA     |

|   | YYF   | DS     |

|   | ChuaN | NULL    |

|   | Faith | NULL    |

+----+-------+--------+

至此，增量备份&恢复完成。

〇总结一下xtrabackup备份及恢复全过程：

1、备份操作，需要提供具有足够权限的MySQL用户，并且mysqld启动用户需要对datadir有rwx的权限。
2、prepare，将未提交的事务回滚，将已提交的事务写入数据文件。
3、停止mysqld服务
4、mv data/ data_bak_.../
5、copyback回去
6、修改权限新的datadir权限
7、启动服务

当然，上述所有的备份对象，都是针对整个MySQL实例。

〇参考资料：

官方手册：
https://www.percona.com/doc/percona-xtrabackup/2.3/index.html
云栖社区@白及88用户：
https://yq.aliyun.com/articles/45746

本文转自

Percona XtraBackup 实现全备&增量备份与恢复-神谕丶-ITPUB博客
http://blog.itpubhttp.itpub.net/29773961/viewspace-2135920/

Percona XtraBackup 实现全备&增量备份与恢复【转】的更多相关文章

Percona XtraBackup 完全及增量备份与恢复的方法
安装及备份.恢复实现安装:其最新版的软件可从 http://www.percona.com/software/percona-xtrabackup/ 获得.本文基于CentOS6.x的系统,因此,直 ...
通过Percona Xtrabackup实现数据的备份与恢复
Xtrabackup简介 Percona XtraBackup是一个开源.免费的MySQL热备份软件,能够为InnoDB和XtraDB数据库执行非阻塞备份,特点如下: 1.快速.可靠的完成备份 2.备 ...
MariaDB之基于Percona Xtrabackup备份大数据库[完整备份与增量备份]
MariaDB之基于Percona Xtrabackup备份大数据库[完整备份与增量备份] 1.Xtrabackup的安装 percona-xtrabackup-2.2.3-4982.el6.x86_ ...
Percona Xtrabackup备份mysql全库及指定数据库(完整备份与增量备份)
原文地址:http://www.tuicool.com/articles/RZRnq2 Xtrabackup简介 Percona XtraBackup是开源免费的MySQL数据库热备份软件,它能对In ...
Percona Xtrabackup备份mysql大数据库(完整备份与增量备份)
Percona Xtrabackup备份mysql大数据库(完整备份与增量备份) 文章目录 [隐藏] Xtrabackup简介 Xtrabackup安装 Xtrabackup工具介绍 inno ...
Percona XtraBackup的部分备份与恢复/单库备份/单表备份/指定库备份/指定表备份
本文是翻译的Percona XtraBackup 2.2版的官方文档,原文地址在此:https://www.percona.com/doc/percona-xtrabackup/2.2/innobac ...
Xtrabackup实现数据的备份与恢复
Xtrabackup介绍 Xtrabackup是由percona开源的免费数据库热备份软件,它能对InnoDB数据库和XtraDB存储引擎的数据库非阻塞地备份(对于MyISAM的备份同样需要加表锁): ...
Percona Xtrabackup 备份MySQL 实例(转)
老规矩,开场白,刚开始用mysqldump,备份100G+的数据库,再加上服务器繁忙,备份速度像蜗牛似的,于是寻找更高效的备份方法.网上都说用xtrabackup比较适合备份大的数据库,而且备份效率也 ...
Percona XtraBackup 8.0.26使用说明
欢迎来到 GreatSQL社区分享的MySQL技术文章,如有疑问或想学习的内容,可以在下方评论区留言,看到后会进行解答 Percona XtraBackup特性说明 Percona Xtrabacku ...

随机推荐

基于element-ui的后台系统表格、dialog、筛选、自定义按钮、分页的一次性封装
方便基础业务开发封装的一套组件,基于vue2.5.x和element-ui,可以通过配置自动生成表格展示,表格新增.编辑功能.分页.筛选项.自定义显示表格数据等功能. 先上演示图片 --------- ...
（待修莫队没过！抽空在检查）Dynamic len(set(a[L:R])) UVA - 12345
#include <iostream> #include <cstdio> #include <sstream> #include <cstring> ...
【刷题】BZOJ 2190 [SDOI2008]仪仗队
Description 作为体育委员,C君负责这次运动会仪仗队的训练.仪仗队是由学生组成的N * N的方阵,为了保证队伍在行进中整齐划一,C君会跟在仪仗队的左后方,根据其视线所及的学生人数来判断队伍是 ...
BZOJ 1013 | 一份写了一堆注释的高斯消元题解
题意给出$n$维直角坐标系中$n + 1$个点的坐标,它们都在一个$n$维球面上,求球心坐标. 题解设球面上某两个点坐标为$(a_1, a_2, ... a_n)$和\((b_1, ...
搭建hadoop集群
hadoop的架构 HDFS + MapReduce = Hadoop MapReduce = Mapper + Reducer hadoop的生态系统准备四个节点,系统版本为CentOS7.3 1 ...
Java虚拟机加载类
Java虚拟机是如何加载Java类的 Java虚拟机加载Java类总共需要经过3步:加载-----链接-----初始化.Java语言的类型可以分为两大类:基本类型和引用类型.基本类型是有Java虚拟机 ...
Android Studio中多项目共享Library
FAQ: as的projectA中有一个commonLib的源码库模块,projectB要调用其中的commonLib, 这个有没有方案?不用手动拷贝aar的方案1. 采用gradle配置参数方 ...
Codeforces 901C. Bipartite Segments（思维题）
擦..没看见简单环..已经想的七七八八了,就差一步显然我们只要知道一个点最远可以向后扩展到第几个点是二分图,我们就可以很容易地回答每一个询问了,但是怎么求出这个呢. 没有偶数简单环,相当于只有奇数简 ...
python基础之函数进阶之函数作为返回值/装饰器
因为装饰器需要用到返回函数的知识,所以在这里将返回函数和装饰器合并讲解. 什么是返回函数? 我们知道,一个函数中return可以返回一个或者多个值,但其实,return不仅可以返回值,还可以返回函数. ...
NO.4day LINUX centos 文件基本操作
LINUX centos 文件基本操作 1 LINUX简介 Linux的定义:Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和UNIX的多用户.多任务.支持多线程和多CP ...

Percona XtraBackup 实现全备&增量备份与恢复【转】

Percona XtraBackup 实现全备&增量备份与恢复【转】的更多相关文章

随机推荐

热门专题