一、简介

1 认识

Rsync(remote synchronize)是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件。Rsync使用所谓的“Rsync算法”来使本地和远 程两个主机之间的文件达到同步,这个算法只传送两个文件的不同部分,而不是每次都整份传送,因此速度相当快;

Rsync支持大多数的类Unix系统,无论是Linux、Solaris还是BSD上都经过了良好的测试;

此外,它在windows平台下也有相应的版本,如cwRsync和Sync2NAS等工具

2 原理

Rsync本来是用于替代rcp的一个工具,目前由rsync.samba.org维护,所以rsync.conf文件的格式类似于samba的主配 置文件;

Rsync可以通过rsh或ssh使用,也能以daemon模式去运行
在以daemon方式运行时Rsync server会打开一个873 端口,等待客户端去连接。

连接时,Rsync server会检查口令是否相符,若通过口令查核,则可以开始进行文件传输。第一次连通完成时,会把整份文件传输一次,以后则就只需进行增量备份。

3 特点

  • 可以镜像保存整个目录树和文件系统;

  • 可以很容易做到保持原来文件的权限、时间、软硬链接等;

  • 无须特殊权限即可安装;

  • 优化的流程,文件传输效率高;

  • 可以使用rsh、ssh等方式来传输文件,当然也可以通过直接的socket连接;

  • 支持匿名传输

二、ssh模式

1 本地间同步

环境:172.16.22.12

# mkdir src
# touch src/{1,2,3,4}
# mkdir dest
# rsync -av src/ dest/ --将 src 目录里的所有的文件同步至 dest 目录(不包含src本身)
# rsync -av src dest/ --将 src 目录包括自己整个同步至 dest 目录
# rsync -avR src/ dest/ --即使 src 后面接有 / ,效果同上

2、局域网间同步

环境:172.16.22.11

# mkdir src
# touch src/{a,b,c,d}
# mkdir dest
# rsync -av 172.16.22.12:/data/test/src/ dest/ --远程同步至本地,需输入root密码
# rsync -av src/ 172.16.22.12:/data/test/dest/ --本地文件同步至远程
# rsync -av src 172.16.22.12:/data/test/dest/ --整个目录同步过去
# rm -rf src/d --删除一个文件 d
# rsync -av --delete src/ 172.16.22.12:/data/test/dest/ --delete,从目标目录里面删除无关的文件

3、局域网指定用户同步

172.16.22.12

# useradd george
# passwd george
# mkdir /home/george/test
# touch /home/george/test/g{1,2,3,4}

172.16.22.11

# rsync -av src '-e ssh -l george' 172.16.22.12:/home/george --本地同步至远程
# rsync -av 172.16.22.12:/home/george/test/g* '-e ssh -l george -p 22' dest/

三、daemon模式

环境:192.168.22.11

1、服务启动方式

1.1、对于负荷较重的 rsync 服务器应该使用独立运行方式

# yum install rsync xinetd --服务安装
# /usr/bin/rsync --daemon

1.2、对于负荷较轻的 rsync 服务器可以使用 xinetd 运行方式

# yum install rsync xinetd --服务安装
# vim /etc/xinetd.d/rsync --配置托管服务,将下项改为 no
disable = no
# /etc/init.d/xinetd start --启动托管服务 xinetd
# chkconfig rsync on
# netstat -ntpl | grep 873 --查看服务是否启动

2、配置详解

两种 rsync 服务运行方式都需要配置 rsyncd.conf,其格式类似于 samba 的主配置文件

全局参数

  • 在全局参数部分也可以定义模块参数,这时该参数的值就是所有模块的默认值

  • address —在独立运行时,用于指定的服务器运行的 IP 地址;由 xinetd 运行时将忽略此参数,使用命令行上的 –address 选项替代。默认本地所有IP

  • port —指定 rsync 守护进程监听的端口号。由 xinetd 运行时将忽略此参数,使用命令行上的 –port 选项替代。默认 873

  • motd file —指定一个消息文件,当客户连接服务器时该文件的内容显示给客户

  • pid file —rsync 的守护进程将其 PID 写入指定的文件

  • log file —指定 rsync 守护进程的日志文件,而不将日志发送给 syslog

  • syslog facility —指定 rsync 发送日志消息给 syslog 时的消息级别

  • socket options —指定自定义 TCP 选项

  • lockfile —指定rsync的锁文件存放路径

  • timeout = 600 —超时时间

模块参数

模块参数主要用于定义 rsync 服务器哪个目录要被同步。模块声明的格式必须为 [module] 形式,这个名字就是在 rsync 客户端看到的名字,类似于 Samba 服务器提供的共享名。而服务器真正同步的数据是通过 path 来指定的

基本模块参数

  • path —指定当前模块在 rsync 服务器上的同步路径,该参数是必须指定的

  • comment —给模块指定一个描述,该描述连同模块名在客户连接得到模块列表时显示给客户

模块控制参数

  • use chroot = —默认为 true,在传输文件之前首先 chroot 到 path 参数所指定的目录下;优点,安全;缺点,需要 root 权限,不能备份指向 path 外部的符号连接所指向的目录文件

  • uid = —指定该模块以指定的 UID 传输文件;默认nobody

  • gid = —指定该模块以指定的 GID 传输文件;默认nobody

  • max connections —最大并发连接数,0为不限制

  • lock file —指定支持 max connections 参数的锁文件。默认 /var/run/rsyncd.lock

  • list —指定当客户请求列出可以使用的模块列表时,该模块是否应该被列出。默认为 true,显示

  • read only = —只读选择,也就是说,不让客户端上传文件到服务器上。默认true

  • write only = —只写选择,也就是说,不让客户端从服务器上下载文件。默认false

  • ignore errors —忽略IO错误。默认true

  • ignore nonreadable —指定 rysnc服务器完全忽略那些用户没有访问权限的文件。这对于在需要备份的目录中有些不应该被备份者获得的文件时是有意义的。false

  • timeout = —该选项可以覆盖客户指定的 IP 超时时间。从而确保 rsync 服务器不会永远等待一个崩溃的客户端。对于匿名 rsync 服务器来说,理想的数字是 600(单位为秒)。0 (未限制)

  • dont compress —用来指定那些在传输之前不进行压缩处理的文件。该选项可以定义一些不允许客户对该模块使用的命令选项列表。必须使用选项全名,而不能是简称。当发生拒绝某个选项的情况时,服务器将报告错误信息然后退出。例如,要防止使用压缩,应该是:”dont compress = ”。.gz .tgz .zip .z .rpm .deb .iso .bz2 .tbz

模块文件筛选参数

  • exclude —指定多个由空格隔开的多个文件或目录(相对路径),并将其添加到 exclude 列表中。这等同于在客户端命令中使用 –exclude 来指定模式

  • exclude from —指定一个包含 exclude 规则定义的文件名,服务器从该文件中读取 exclude 列表定义

  • include —指定多个由空格隔开的多个文件或目录(相对路径),并将其添加到 include 列表中。这等同于在客户端命令中使用 –include 来指定模式

  • include from —指定一个包含 include 规则定义的文件名,服务器从该文件中读取 include 列表定义

模块用户认证参数

  • auth users —指定由空格或逗号分隔的用户名列表,只有这些用户才允许连接该模块(和系统用户没有任何关系)。用户名和口令以明文方式存放在 secrets file 参数指定的文件中。默认为匿名方式

  • secrets file —指定一个 rsync 认证口令文件。只有在 auth users 被定义时,该文件才起作用。文件权限必须是 600

  • strict modes —指定是否监测口令文件的权限。为 true 则口令文件只能被 rsync 服务器运行身份的用户访问,其他任何用户不可以访问该文件。默认为true

模块访问控制参数

  • hosts allow —用一个主机列表指定哪些主机客户允许连接该模块。不匹配主机列表的主机将被拒绝。默认值为 *

  • hosts deny —用一个主机列表指定哪些主机客户不允许连接该模块

模块日志参数

  • transfer logging —使 rsync 服务器将传输操作记录到传输日志文件。默认值为false

  • log format —指定传输日志文件的字段。默认为:”%o %h [%a] %m (%u) %f %l”
    设置了”log file”参数时,在日志每行的开始会添加”%t [%p]“;
    可以使用的日志格式定义符如下所示:
    %o —操作类型:”send” 或 “recv”
    %h —远程主机名
    %a —远程IP地址
    %m —模块名
    %u —证的用户名(匿名时是 null)
    %f —文件名
    %l —文件长度字符数
    %p —该次 rsync 会话的 PID
    %P —模块路径
    %t —当前时间
    %b —实际传输的字节数
    %c —当发送文件时,记录该文件的校验码

3、服务端配置

# vim /etc/rsyncd.conf --为 rsyncd 服务编辑配置文件,默认没有,需自己编辑
  • uid = root —rsync运行权限为root

  • gid = root —rsync运行权限为root

  • use chroot = no —是否让进程离开工作目录

  • max connections = 5 —最大并发连接数,0为不限制

  • timeout = 600 —超时时间

  • pid file = /var/run/rsyncd.pid —指定rsync的pid存放路径

  • lockfile = /var/run/rsyncd.lock —指定rsync的锁文件存放路径

  • log file = /var/log/rsyncd.log —指定rsync的日志存放路径

  • [web1] —模块名称
    path = /data/test/src —该模块存放文件的基础路径
    ignore errors = yes —忽略一些无关的I/O错误
    read only = no —客户端可以上传
    write only = no —客户端可以下载
    hosts allow = 192.168.22.12 —允许连接的客户端主机ip
    hosts deny = —黑名单,表示任何主机
    list = yes
    auth users = web —认证此模块的用户名
    secrets file = /etc/web.passwd —指定存放“用户名:密码”格式的文件

# mkdir /data/test/src --创建基础目录
# mkdir /data/test/src/george --再创建一个目录
# touch /data/test/src/{1,2,3}
# echo "web:123" > /etc/web.passwd --创建密码文件
# chmod 600 /etc/web.passwd
# service xinetd restart

四、测试

1、客户端

环境:192.168.22.12

# yum -y install rsync
# mkdir /data/test

2、小试参数

# rsync -avzP web@192.168.22.11::web1 /data/test/ --输入密码 123;将服务器 web1 模块里的文件同步至 /data/test,参数说明:
  • -a —参数,相当于-rlptgoD

  • -r —是递归

  • -l —是链接文件,意思是拷贝链接文件

  • -i —列出 rsync 服务器中的文件

  • -p —表示保持文件原有权限

  • -t —保持文件原有时间

  • -g —保持文件原有用户组

  • -o —保持文件原有属主

  • -D —相当于块设备文件

  • -z —传输时压缩

  • -P —传输进度

  • -v —传输时的进度等信息,和-P有点关系

# rsync -avzP --delete web@192.168.22.11::web1 /data/test/ --让客户端与服务器保持完全一致, --delete
# rsync -avzP --delete /data/test/ web@192.168.22.11::web1 --上传客户端文件至服务端
# rsync -avzP --delete /data/test/ web@192.168.22.11::web1/george --上传客户端文件至服务端的 george 目录
# rsync -ir --password-file=/tmp/rsync.password web@192.168.22.11::web1 --递归列出服务端 web1 模块的文件
# rsync -avzP --exclude="*3*" --password-file=/tmp/rsync.password web@192.168.22.11::web1 /data/test/ --同步除了路径以及文件名中包含 “3” *的所有文件

3、通过密码文件同步

# echo "123"> /tmp/rsync.password
# chmod 600 /tmp/rsync.password
# rsync -avzP --delete --password-file=/tmp/rsync.password web@192.168.22.11::web1 /data/test/ --调用密码文件

4、客户端自动同步

# crontab -e

10 0 * rsync -avzP —delete —password-file=/tmp/rsync.password web@192.168.22.11::web1 /data/test/

# crontab -l

五、数据实时同步

环境:Rsync + Inotify-tools

1、inotify-tools

是为linux下 inotify文件监控工具提供的一套c的开发接口库函数,同时还提供了一系列的命令行工具,这些工具可以用来监控文件系统的事件

inotify-tools是用c编写的,除了要求内核支持 inotify 外,不依赖于其他

inotify-tools提供两种工具:一是inotifywait,它是用来监控文件或目录的变化,二是inotifywatch,它是用来统计文件系统访问的次数

2、安装inotify-tools

下载地址:http://github.com/downloads/rvoicilas/inotify-tools/inotify-tools-3.14.tar.gz

# yum install –y gcc --安装依赖
# mkdir /usr/local/inotify
# tar -xf inotify-tools-3.14.tar.gz
# cd inotify-tools-3.14
# ./configure --prefix=/usr/local/inotify/
# make && make install

3、设置环境变量

# vim /root/.bash_profile

export PATH=/usr/local/inotify/bin/:$PATH

# source /root/.bash_profile
# echo '/usr/local/inotify/lib' >> /etc/ld.so.conf --加载库文件
# ldconfig
# ln -s /usr/local/inotify/include /usr/include/inotify

4、常用参数

  • -m —始终保持监听状态,默认触发事件即退出

  • -r —递归查询目录

  • -q —打印出监控事件

  • -e —定义监控的事件,可用参数:

  • access —访问文件

  • modify —修改文件

  • attrib —属性变更

  • open —打开文件

  • delete —删除文件

  • create —新建文件

  • move —文件移动

  • —fromfile —从文件读取需要监视的文件或者排除的文件,一个文件一行,排除的文件以@开头

  • —timefmt —时间格式

  • —format —输出格式

  • —exclude —正则匹配需要排除的文件,大小写敏感

  • —excludei —正则匹配需要排除的文件,忽略大小写

  • %y%m%d %H%M —年月日时钟

  • %T%w%f%e —时间路径文件名状态

5、测试一

检测源目录中是否有如下动作:modify,create,move,delete,attrib;

一旦发生则发布至目标机器;

方式为 ssh
src: 192.168.22.11(Rsync + Inotify-tools) dest: 192.168.22.12

两台机器需要做好 ssh 免密登录

# mdkir /data/test/dest/ --dest机器
# mdkir /data/test/src/ --src机器
# rsync -av --delete /data/test/src/ 192.168.22.12:/data/test/dest --测试下命令
# vim /data/test/test.sh
#!/bin/bash
/usr/local/inotify/bin/inotifywait -mrq -e modify,create,move,delete,attrib /data/test/src | while read events
do
rsync -a --delete /data/test/src/ 192.168.22.12:/data/test/dest
echo "`date +'%F %T'` 出现事件:$events" >> /tmp/rsync.log 2>&1
done
# chmod 755 /data/test/test.sh
# /data/test/test.sh &
# echo '/data/test/test.sh &' >> /etc/rc.local --设置开机自启

我们可以在目标机上也写一个这样的脚本:

rsync -a —delete /data/test/dest/ 192.168.22.11:/data/test/src ;

这样可以实现双向同步

Linux 远程数据同步工具详解的更多相关文章

  1. rsync 远程数据同步工具详解

    rysnc 命令用法:(OPTION-参数,USER-用户,HOST-IP地址,SRC-复制源位置,DEST-复制目标位置)Shell拉:rsync [OPTION] [USER@]HOST:SRC ...

  2. Linux系统备份还原工具4(rsync/远程数据同步工具)

    rsync即是能备份系统也是数据同步的工具. 在Jenkins上可以使用rsync结合SSH的免密登录做数据同步和分发.这样一来可以达到部署全命令化,不需要依赖任何插件去实现. 命令参考:http:/ ...

  3. Windows远程数据同步工具cwRsync

    1. cwRsync简介cwRsync是Rsync在Windows上的实现版本,Rsync通过使用特定算法的文件传输技术,可以在网络上传输只修改了的文件.cwRsync主要用于Windows上的远程文 ...

  4. rsync远程数据同步工具的使用

    准备工作 虚拟机1: 192.168.24.41, 用于搭建rsync服务器 虚拟机2: 192.168.26.68, 用于搭建rsync客户端 虚拟机1和虚拟机2均为centos7; 1. 检查虚拟 ...

  5. Spark学习笔记--Linux安装Spark集群详解

    本文主要讲解如何在Linux环境下安装Spark集群,安装之前我们需要Linux已经安装了JDK和Scala,因为Spark集群依赖这些.下面就如何安装Spark进行讲解说明. 一.安装环境 操作系统 ...

  6. rsync---远程数据同步工具

    rsync命令是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件.rsync使用所谓的“rsync算法”来使本地和远程两个主机之间的文件达到同步,这个算法只传送两个文件的不同部分,而 ...

  7. Linux实战教学笔记21:Rsync数据同步工具

    第二十一节 Rsync数据同步工具 标签(空格分隔): Linux实战教学笔记-陈思齐 ---本教学笔记是本人学习和工作生涯中的摘记整理而成,此为初稿(尚有诸多不完善之处),为原创作品,允许转载,转载 ...

  8. 【转】Linux 网络工具详解之 ip tuntap 和 tunctl 创建 tap/tun 设备

    原文:https://www.cnblogs.com/bakari/p/10449664.html -------------------------------------------------- ...

  9. Linux学习之守护进程详解

    Linux系统守护进程详解                                                              ---转自:http://yuanbin.blog ...

  10. Linux之rsync同步工具介绍+inotify同步

    1.rsync介绍 Rsync是一款开源的.快速的.多功能的.可实现全量及增量的本地或远程数据同步备份的优秀工具.Rsync软件适用于unix/linux/windows等多种操作平台. rsync, ...

随机推荐

  1. [UnityShader]unity中2D Sprite显示阴影和接受阴影

    首先是效果 要让2D显示阴影,首先假设知道Unity阴影来源(shader中的ShadowCaster) 最简单的方法是,首先从官网下载Sprite-Default.Shader,查看源码 然后复制粘 ...

  2. c++ 时间类型详解 time_t(转)

    原文链接:https://blog.csdn.net/love_gaohz/article/details/6637625 Unix时间戳(Unix timestamp),或称Unix时间(Unix ...

  3. windows运行xcopy计划任务 结果是0x4解决方案

    近几天发现一直好好的数据备份计划任务一直返回0x4失败,直接执行bat又是正常的. bat命令中使用的是xcopy,到处找方案没解决. 今天意外在使用另一个命令时,发现提示:网络连接数据超过最大值. ...

  4. vue跨行跨列动态表格生成

    一.思路步骤: 根据后台传输的数据进行格式转化: 索引为多少的时候进行跨行: <table id="table"> <thead> <tr> & ...

  5. kubectl查询日志命令

    防水堡 bug日志定位命令: docker logs --tail 100 xxx:xxx 是容器的id 或者名称kubectl logs-f --tail 100 xxx:xxx 是pod 的id, ...

  6. 记:空格normalize-space处理方法

    xpath中定位元素文本含空格 含义:通过去掉前导和尾随空白并使用单个空格替换一系列空白字符,使空白标准化 通俗一点:使要定位的文本元素,去空格并规范化 //li [normalize-space(t ...

  7. Easyui 表格列数据合并!

    //datagrid调用列子 onLoadSuccess: function (data) { $(".datagrid-header-row").css("text-a ...

  8. oracle 行转列,动态年份,月份列。已解决!

    -----------------存储过程包体----------- procedure GetComparativeAnalysisTB(p_StartTime varchar2, ----开始时间 ...

  9. ES6 新语法新特性总结中...

    1. 感觉 for of   通杀 for循环 和 for in呢 aaa 可以是array /object for (let k of aaa) {     console.log(k) }   2 ...

  10. git remote prune origin删除本地有但在远程库已经不存在的分支

    先调用git remote show origin 该命令能够获取远端分支信息,你可以看到和本地和远端不同步的地方: 过时的就是和本地不同步的分支,本地已过时的表示你需要移除这个分支了. 这个时候你需 ...