linux下rsync和tar增量备份梳理

前面总结过一篇全量备份/增量备份/差异备份说明，下面介绍下linux下rsync和tar两种增量备份的操作记录：

1）rsync备份

rsync由于本身的特性，在第一次rsync备份后，以后每次都只是传内容有改变的部分，而不是全部传。所以，rsync在做镜像方面是很不错的，只传增量，节省带宽、时间。

常规本地rsync备份命令可以是：

# rsync -az --delete SRC DST

其中：

-z 压缩

-a 简单理解就是保持一致性

--delete 严格保证DST内容与SRC一致，即DST中SRC没有的文件会被删除掉   （--delete-before表示在进行同步之前，先将目标目录全部删除，然后再进行同步操作）

实例如下：

[root@linux-node3 mnt]# mkdir test

[root@linux-node3 mnt]# cd test/

[root@linux-node3 mnt]# ls

test

[root@linux-node3 test]# echo "a1" > a1.txt

[root@linux-node3 test]# echo "a2" > a2.txt

[root@linux-node3 test]# echo "a3" > a3.txt

[root@linux-node3 test]# ls

a1.txt  a2.txt  a3.txt  aaa

现在使用rsync进行增量备份

[root@linux-node3 mnt]# rsync -az --delete test /opt/

[root@linux-node3 mnt]# ls /opt/

test

[root@linux-node3 mnt]# ls /opt/

test  wang

[root@linux-node3 mnt]# rsync -az --delete test /opt/

[root@linux-node3 mnt]# ls /opt/

test  wang

[root@linux-node3 mnt]# ls /opt/test/

a1.txt  a2.txt  a3.txt  a4  aaa

注意：

--delete参数要放在源目录和目标目录前，并且两个目录结构一定要一致！不能使用./*。

如果目录结构不一致，则不会删除目标目录中的目录。如上，/opt/wang目录由于目录结构不一致，故它是多余的但不删除。

现在进行增量备份，rsync在第一次同步后，后面就只同步内容有改变的部分

温馨提示：

rsync使用--delete参数，在做增量方式的全备份可以说是最佳选择。但这样只有一个副本，也就是说如果你想查以前某个时间段的数据，是没法查到的。

2）tar打包备份

tar的备份就是把文件打包起来，保存到其他地方，可以满足查档要求，也即上面说到的。

再配合crontab，就可以实现定时增量备份

下面说说tar的三种增量备份方式：

------------------------------------------------------------------------------------------------

a）第一种方式：tar -g snapshot方法

利用tar -g参数，在第一次备份时候生成时间戳文件，里面包含指定备份目录下的所有文件的一个时间戳，下次增量备份，tar会利用时间戳文件去比较，只有那些内容在这段时间有修改的文件，才会被打包。

实例说明：

[root@linux-node3 mnt]# ls

[root@linux-node3 mnt]# mkdir test

[root@linux-node3 mnt]# echo "123" > test/test1

[root@linux-node3 mnt]# echo "123123" > test/test2

[root@linux-node3 mnt]# mkdir test/aaa

[root@linux-node3 mnt]# ls test/

aaa  test1  test2

先执行完整备份

[root@linux-node3 mnt]# tar -g snapshot -zcf backup_full.tar.gz test

[root@linux-node3 mnt]# ls

aaa  backup_full.tar.gz  snapshot  test

[root@linux-node3 mnt]# cat snapshot

GNU tar-1.23-2

1490172505723210801014901724572030064696476940641test/aaa014901724572030064696476940639testDaaaYtest1Ytest2

接下来进行差异和增量备份操作：

增加数据

[root@linux-node3 mnt]# echo "aaaaa" >> test/test1

[root@linux-node3 mnt]# echo "aaaaa11111" >> test/test3

[root@linux-node3 mnt]# ls test/

aaa  test1  test2  test3

执行第一次的增量备份 (注意tarball档名)

[root@linux-node3 mnt]# tar -g snapshot -zcf backup_incremental_1.tar.gz test

[root@linux-node3 mnt]# ls

aaa  backup_full.tar.gz  backup_incremental_1.tar.gz  snapshot  test

[root@linux-node3 mnt]# cat snapshot

GNU tar-1.23-2

1490172606339019504014901724572030064696476940641test/aaa014901725622320064796476940639testDaaaYtest1Ntest2Ytest3

再增加差异数据

[root@linux-node3 mnt]# echo "77777" > test/test1

[root@linux-node3 mnt]# echo "6666" >> test/test2

[root@linux-node3 mnt]# touch test/aaaa

[root@linux-node3 mnt]# ls test/

aaa  aaaa  test1  test2  test3

执行第二次的增量备份

[root@linux-node3 mnt]# tar -g snapshot -zcf backup_incremental_2.tar.gz test

[root@linux-node3 mnt]# ls

aaa  backup_full.tar.gz  backup_incremental_2.tar.gz  backup_incremental_1.tar.gz  snapshot  test

[root@linux-node3 mnt]# cat snapshot

GNU tar-1.23-2

149017272274896944014901724572030064696476940641test/aaa014901726931200065246476940639testDaaaYaaaaYtest1Ytest2Ntest3

现在进行测试，删除测试数据test

[root@linux-node3 mnt]# rm -rf test/

[root@linux-node3 mnt]# ls

aaa  backup_full.tar.gz  backup_incremental_2.tar.gz  backup_incremental_1.tar.gz  snapshot

开始进行数据还原

恢复第一次全备份的数据

[root@linux-node3 mnt]# tar zxf backup_full.tar.gz

[root@linux-node3 mnt]# ls

aaa  backup_full.tar.gz  backup_incremental_2.tar.gz  backup_incremental_1.tar.gz  snapshot  test

[root@linux-node3 mnt]# ls test/

aaa  test1  test2

[root@linux-node3 mnt]# cat test/test1

123

恢复第一次增量备份的数据

[root@linux-node3 mnt]# tar zxf backup_incremental_1.tar.gz

[root@linux-node3 mnt]# ls test/

aaa  test1  test2  test3

[root@linux-node3 mnt]# cat test/test1

123

aaaaa

[root@linux-node3 mnt]# cat test/test3

aaaaa11111

恢复第二次增量备份的数据

[root@linux-node3 mnt]# tar zxf backup_incremental_2.tar.gz

[root@linux-node3 mnt]# ls test/

aaa  aaaa  test1  test2  test3

[root@linux-node3 mnt]# cat test/test1

77777

[root@linux-node3 mnt]# cat test/test2

123123

6666

最后可以结合crontab实现定时增量备份

第一次手动进行全备份，生成snapshot时间戳文件，后面写增量备份脚本

[root@linux-node3 ~]# vim  backup_incremental.sh

#!/bin/bash

DATE=`date +%Y%m%d%H%M%S`

/bin/tar -g /mnt/snapshot -zcf /mnt/backup_incremental_$DATE.tar.gz /mnt/test

进行定时增量备份操作

[root@linux-node3 ~]# crontab -e

#每小时进行一次增量备份

0 * * * * /bin/bash -x /root/backup_incremental.sh > /dev/null 2>&1

从上面可以看出：

snapshot作为时间戳文件，它记录备份目录里面每个文件的一个当前修改时间，只要下次备份时候，再利用-g ~/snapshot指定上次生成的时间戳文件就可以实现增量备份！

可能出现下面两种问题：

-->  snapshot时间戳文件是每次增量备份完成时候更新的，如果在两次备份间隔间，由于io问题，上次备份没完成，第二次增量备份就开始的话，

就有可能出现，第二次增量备份并不是一个备份间隔有修改过的文件，而是两次；如果IO问题一直存在，就会一直累积备份，最后系统超负载，性能变得极差

--> 上次备份失败（意外终止）

这样的情况，要看是在什么时候终止，因为tar命令在增量备份时候会先扫一遍文件，比较修改时间，因此，有可能备份进程意外终止后，导致时间戳文件清空，下次增量备份就变成全备了，严重影响备份策略！

--------------------------------------------------------------------------

b）第二种方式：tar -g tarinfo增量备份方法

只需要指定-g参数，tarinfo文件则是用来记录备份的一些信息

1）创建备份测试目录wang

[root@zabbix-server opt]# pwd

/opt

[root@zabbix-server opt]# echo "1111" > wang/1.txt

[root@zabbix-server opt]# echo "2222" > wang/2.txt

[root@zabbix-server opt]# echo "3333" > wang/3.txtwang

[root@zabbix-server opt]# ls wang/

1.txt  2.txt  3.txt  

2）进行完整备份

[root@zabbix-server opt]# tar -g tarinfo -czf backup-full.tar.gz wang/

[root@zabbix-server opt]# ls

backup-full.tar.gz  tarinfo  wang

3）新增文件

[root@zabbix-server opt]# echo "4444" > wang/4.txt

[root@zabbix-server opt]# echo "12121" >> wang/1.txt

4）进行增量备份

[root@zabbix-server opt]# tar -g tarinfo -czf backup-incre1.tar.gz wang/

[root@zabbix-server opt]# ls

backup-full.tar.gz  backup-incre1.tar.gz  tarinfo  wang

[root@zabbix-server opt]# cat tarinfo

GNU tar-1.23-2

1508989798794775692015089897819623314720538519682wangY1.txtN2.txtN3.txtY4.txt

5）删除wang目录，进行恢复（先全量恢复，再增量恢复）

[root@zabbix-server opt]# rm -rf wang

[root@zabbix-server opt]# ls

backup-full.tar.gz  backup-incre1.tar.gz  tarinfo

[root@zabbix-server opt]# tar -zvxf backup-full.tar.gz

wang/

wang/1.txt

wang/2.txt

wang/3.txt

[root@zabbix-server opt]# ls wang/

1.txt  2.txt  3.txt

[root@zabbix-server opt]# cat wang/1.txt

1111

[root@zabbix-server opt]# tar -zvxf backup-incre1.tar.gz

wang/

wang/1.txt

wang/4.txt

[root@zabbix-server opt]# ls wang/

1.txt  2.txt  3.txt  4.txt

[root@zabbix-server opt]# cat wang/1.txt

1111

12121

--------------------------------------------------------------------------

c）第三种方式：

还是觉得tar -g snapshot最大的问题就是不可控，而且稳定性较差，出现备份重叠时候很难处理好。

因此，可以利用find+tar来做增量备份的想法。利用find命令找出最近修改的文件名列表，然后再利用tar打包

实例如下：

[root@linux-node3 ~]# ls /mnt/

test

[root@linux-node3 ~]# ls /mnt/test/

aaa  aaaa  test1  test2  test3

备份/mnt/test目录下30分钟以内修改的文件

先使用find命令列出最近有修改的文件名列表，保存到文件

[root@linux-node3 ~]# find /mnt/test -mmin -30 -type f >> /mnt/listfile

[root@linux-node3 ~]# ls /mnt/

listfile  test

[root@linux-node3 ~]# cat /mnt/listfile

/mnt/test/test2

/mnt/test/aaaa

/mnt/test/test1

然后使用tar命令对文件列表列出的文件名进行打包备份

[root@linux-node3 ~]# tar -zcf test.tgz -T /mnt/listfile

tar: Removing leading `/' from member names

[root@linux-node3 ~]# ls /mnt

listfile        test.tgz            test

同理备份/mnt/test目录下1天之内修改的数据

[root@linux-node3 ~]# find /mnt/test  -mtime -1 -type f >> /mnt/listfile2

[root@linux-node3 ~]# tar -zcf test2.tgz -T /mnt/listfile2

这样恢复的时候，需要恢复到哪个阶段的数据，就利用这个阶段备份的打包文件进行恢复即可！

这种方式来做增量备份，即使某个时间段机器性能很差，备份重叠，也不会影响到各自的备份进程。

此外，find命令生成的文件list，还可以方便以后查档，直接对list搜索指定文件，不用去tar查看。

linux下rsync和tar增量备份梳理的更多相关文章

Linux下Rsync+sersync实现数据实时同步
inotify 的同步备份机制有着缺点,于是看了sersync同步,弥补了rsync的缺点.以下转自:http://www.osyunwei.com/archives/7447.html 前言: 一. ...
Linux下Rsync+Inotify-tools实现数据实时同步
Linux下Rsync+Inotify-tools实现数据实时同步注意:下面的三个案例都是rsync 每次都是全量的同步(这就坑爹了),而且 file列表是循环形式触发rsync ,等于有10个文件 ...
LINUX学习笔记——LINUX下EXP命令全库备份数据库文件
LINUX下EXP命令全库备份数据库文件 1)建立备份目录,目录操作权限授权给Oracle用户 mkdir /backup --创建backup文件夹 cd / --进入cd语句 ls -l ...
Linux rsync数据定时增量备份
一.安装rsync服务端 1.查看是否安装rsync ps -ef | grep rsync 系统一般默认已安装,安装方法: yum -y install rsync 2.添加配置文件 rsync没有 ...
linux下rsync+inotify实现服务器之间文件实时同步
先介绍一下rsync与inotify. 1.rsync 与传统的cp.tar备份方式相比,rsync具有安全性高.备份迅速.支持增量备份等优点,通过rsync可以解决对实时性要求不高的数据备份需求,例 ...
Linux下rsync命令使用总结
一.rsync的概述 rsync是类unix系统下的数据镜像备份工具,从软件的命名上就可以看出来了——remote sync.rsync是Linux系统下的文件同步和数据传输工具,它采用“rsync” ...
Linux下rsync的用法
一.rsync的概述 rsync是类unix系统下的数据镜像备份工具,从软件的命名上就可以看出来了——remote sync.rsync是Linux系统下的文件同步和数据传输工具,它采用“rsync” ...
linux下rsync的同步
rsync是linux系统下的数据镜像备份工具.使用快速增量备份工具Remote Sync可以远程同步,支持本地复制,或者与其他SSH.rsync****主机同步文件下载地址: 链接:https:/ ...
centos7下rsync+crontab定期同步备份
最近需求想定期备份内部重要的服务器数据到存储里面,顺便做个笔记以前整过一个win下的cwrsync(客户端)+rsync(服务端:存储)的bat脚本这次整一个Linux下的脚本sh,执行定期自动备 ...

随机推荐

CSS| 學習心得
resize :both , 只有overflow設置為auto時, 才能起作用???
这不是我想要的ABAP开发者
原文在此: These Aren’t the Developers You’re Looking for 在吃饼干的过程中偶然看到这篇文章,立刻被UC化的标题吸引到了. 全文读完,感觉作者还是有点刻薄 ...
leetcode 5. Longest Palindromic Substring [java]
public String longestPalindrome(String s) { String rs = ""; int res = 0; for(int i = 0; i& ...
HTTP数据组织方式
HTTP网络传输中的数据组织方式有三种方式: 1.HTML方式 2.XML方式 3.JSON方式 XML介绍:XML称为可扩展标记语言,它与HTML一样,都是SGML(标准通用标记语言) XM ...
Django templates 模板的语法
MVC 以及 MTV MVC: M : model -->> 存取数据(模型) V: view -->> 信息的展示(视图) C: controller -->> ...
(16)Python练习题
练习题一: 练习题二:
Java中关于CyclicBarrier的使用
CyclicBarrier工具类主要是控制多个线程的一起执行,CyclicBarrier 实例可以多次使用. 演示程序: import java.util.Random; import java.ut ...
windows下elasticsearch6.X安装IK分词器
文章来源:https://www.cnblogs.com/hts-technology/category/1167823.html (一)到官网下载https://github.com/medcl/e ...
ROS教程0 环境配置
1安装环境配置(桌面进入命令行) echo "source /opt/ros/indigo/setup.bash" >> ~/.bashrc source ~/.bas ...
Ros使用Arduino 2 使用rosserial创建一个publisher
1 启动arduino 将arduino开发板连接到电脑的usb口,在arduino IDE中进行设置. 选择Tools->Board,选择你所使用的arduino开发板的类型,所使用的ardu ...

linux下rsync和tar增量备份梳理

linux下rsync和tar增量备份梳理的更多相关文章

随机推荐

热门专题