一文搞定 Redis 复制（全会的举个手看看）

阅读本文大概需要 5 分钟。

本文大纲

复制过程
数据间的同步
全量复制
部分复制
心跳
异步复制
总结

一、复制过程

Step 1：从节点执行 slaveof 命令。

Step 2：从节点只是保存了 slaveof 命令中主节点的信息，并没有立即发起复制。

Step 3：从节点内部的定时任务发现有主节点的信息，开始使用 socket 连接主节点。

Step 4：连接建立成功后，发送 ping 命令，希望得到 pong 命令响应，否则会进行重连。

Step 5：如果主节点设置了权限，那么就需要进行权限验证，如果验证失败，复制终止。

Step 6：权限验证通过后，进行数据同步，这是耗时最长的操作，主节点将把所有的数据全部发送给从节点。

Step 7：当主节点把当前的数据同步给从节点后，便完成了复制的建立流程。接下来，主节点就会持续的把写命令发送给从节点，保证主从数据一致性。

二、数据间的同步

上面说的复制过程，其中有一个步骤是“同步数据集”，这个就是现在讲的“数据间的同步”。

redis 同步有 2 个命令：sync 和 psync，前者是 redis 2.8 之前的同步命令，后者是 redis 2.8 为了优化 sync 新设计的命令。我们会重点关注 2.8 的 psync 命令。

1、psync命令需要3个组件支持

主从节点各自复制偏移量
主节点复制积压缓冲区
主节点运行 ID

2、主从节点各自复制偏移量

参与复制的主从节点都会维护自身的复制偏移量。
主节点在处理完写入命令后，会把命令的字节长度做累加记录，统计信息在 info replication 中的 masterreploffset 指标中。
从节点每秒钟上报自身的的复制偏移量给主节点，因此主节点也会保存从节点的复制偏移量。
从节点在接收到主节点发送的命令后，也会累加自身的偏移量，统计信息在 info replication 中。
通过对比主从节点的复制偏移量，可以判断主从节点数据是否一致。

3、主节点复制积压缓冲区

复制积压缓冲区是一个保存在主节点的一个固定长度的先进先出的队列，默认大小 1MB。
这个队列在 slave 连接是创建。这时主节点响应写命令时，不但会把命令发送给从节点，也会写入复制缓冲区。
他的作用就是用于部分复制和复制命令丢失的数据补救。通过 info replication 可以看到相关信息。

4、主节点运行ID

每个 redis 启动的时候，都会生成一个 40 位的运行 ID。
运行 ID 的主要作用是用来识别 Redis 节点。如果使用 ip+port 的方式，那么如果主节点重启修改了 RDB/AOF 数据，从节点再基于偏移量进行复制将是不安全的。所以，当运行 id 变化后，从节点将进行全量复制。也就是说，redis 重启后，默认从节点会进行全量复制。

5、如果在重启时不改变运行ID呢？

可以通过 debug reload 命令重新加载 RDB 并保持运行 ID 不变，从而有效的避免不必要的全量复制。
缺点是：debug reload 命令会阻塞当前 Redis 节点主线程，因此对于大数据量的主节点或者无法容忍阻塞的节点，需要谨慎使用。一般通过故障转移机制可以解决这个问题。

6、psync命令的使用方式

命令格式为 psync{runId}{offset}
runId：从节点所复制主节点的运行 id
offset：当前从节点已复制的数据偏移量

7、psync执行流程

流程说明：

从节点发送 psync 命令给主节点，runId 就是目标主节点的 ID，如果没有默认为 -1，offset 是从节点保存的复制偏移量，如果是第一次复制则为 -1.主节点会根据 runid 和 offset 决定返回结果：

如果回复 +FULLRESYNC {runId} {offset} ，那么从节点将触发全量复制流程。
如果回复 +CONTINUE，从节点将触发部分复制。
如果回复 +ERR，说明主节点不支持 2.8 的 psync 命令，将使用 sync 执行全量复制。

到这里，数据之间的同步就讲的差不多了，篇幅还是比较长的。主要是针对 psync 命令相关之间的介绍。

三、全量复制

全量复制是 Redis 最早支持的复制方式，也是主从第一次建立复制时必须经历的的阶段。触发全量复制的命令是 sync 和 psync。之前说过，这两个命令的分水岭版本是 2.8，redis 2.8 之前使用 sync 只能执行全量不同，2.8 之后同时支持全量同步和部分同步。

流程如下：

Step 1：发送 psync 命令（spync ？-1）

Step 2：主节点根据命令返回 FULLRESYNC

Step 3：从节点记录主节点 ID 和 offset

Step 4：主节点 bgsave 并保存 RDB 到本地

Step 5：主节点发送 RBD 文件到从节点

Step 6：从节点收到 RDB 文件并加载到内存中

Step 7：主节点在从节点接受数据的期间，将新数据保存到“复制客户端缓冲区”，当从节点加载 RDB 完毕，再发送过去。（如果从节点花费时间过长，将导致缓冲区溢出，最后全量同步失败）

Step 8：从节点清空数据后加载 RDB 文件，如果 RDB 文件很大，这一步操作仍然耗时，如果此时客户端访问，将导致数据不一致，可以使用配置slave-server-stale-data 关闭.

Step 9：从节点成功加载完 RBD 后，如果开启了 AOF，会立刻做 bgrewriteaof。

以上加粗的部分是整个全量同步耗时的地方。

注意：

如过 RDB 文件大于 6GB，并且是千兆网卡，Redis 的默认超时机制（60 秒），会导致全量复制失败。可以通过调大 repl-timeout 参数来解决此问题。
Redis 虽然支持无盘复制，即直接通过网络发送给从节点，但功能不是很完善，生产环境慎用。

四、部分复制

当从节点正在复制主节点时，如果出现网络闪断和其他异常，从节点会让主节点补发丢失的命令数据，主节点只需要将复制缓冲区的数据发送到从节点就能够保证数据的一致性，相比较全量复制，成本小很多。

当从节点出现网络中断，超过了 repl-timeout 时间，主节点就会中断复制连接。
主节点会将请求的数据写入到“复制积压缓冲区”，默认 1MB。
当从节点恢复，重新连接上主节点，从节点会将 offset 和主节点 id 发送到主节点。
主节点校验后，如果偏移量的数后的数据在缓冲区中，就发送 cuntinue 响应 —— 表示可以进行部分复制。
主节点将缓冲区的数据发送到从节点，保证主从复制进行正常状态。

五、心跳

主从节点在建立复制后，他们之间维护着长连接并彼此发送心跳命令。

心跳的关键机制如下：

中从都有心跳检测机制，各自模拟成对方的客户端进行通信，通过 client list 命令查看复制相关客户端信息，主节点的连接状态为 flags = M，从节点的连接状态是 flags = S。
主节点默认每隔 10 秒对从节点发送 ping 命令，可修改配置 repl-ping-slave-period 控制发送频率。
从节点在主线程每隔一秒发送 replconf ack{offset} 命令，给主节点上报自身当前的复制偏移量。
主节点收到 replconf 信息后，判断从节点超时时间，如果超过 repl-timeout 60 秒，则判断节点下线。

注意：

为了降低主从延迟，一般把 redis 主从节点部署在相同的机房/同城机房，避免网络延迟带来的网络分区造成的心跳中断等情况。

六、异步复制

主节点不但负责数据读写，还负责把写命令同步给从节点，写命令的发送过程是异步完成，也就是说主节点处理完写命令后立即返回客户度，并不等待从节点复制完成。

异步复制的步骤很简单，如下：

Step 1：主节点接受处理命令。

Step 2：主节点处理完后返回响应结果。

Step 3：对于修改命令，异步发送给从节点，从节点在主线程中执行复制的命令。

七、总结

本文主要分析了 Redis 的复制原理，包括复制过程，数据之间的同步，全量复制的流程，部分复制的流程，心跳设计，异步复制流程。

其中，可以看出，RDB 数据之间的同步非常耗时。

所以，Redis 在 2.8 版本退出了类似增量复制的 psync 命令，当 Redis 主从直接发生了网络中断，不会进行全量复制，而是将数据放到缓冲区（默认 1MB）里，再通过主从之间各自维护复制 offset 来判断缓存区的数据是否溢出。如果没有溢出，只需要发送缓冲区数据即可，成本很小；反之，则要进行全量复制。因此控制缓冲区大小非常的重要。

作者：五色花的博客

来源：https://www.cnblogs.com/luao/p/10682830.html

·END·

程序员的成长之路

路虽远，行则必至

本文原发于同名微信公众号「程序员的成长之路」，回复「1024」你懂得，给个赞呗。

回复 [ 520 ] 领取程序员最佳学习方式

回复 [ 256 ] 查看 Java 程序员成长规划

往期精彩回顾

Linux 命令多到记不住？这个开源项目帮你一网打尽！

面试题：InnoDB中一棵B+树能存多少行数据？

一个 Java 对象到底有多大？

Spring 中的 18 个注解，你会几个？

为什么培训班出来的程序员总遭人嫌弃？

五种类型的程序员，你属于哪一种？

一个简单又诡异的互联网变现思维（抖音赚钱）

一文搞定 Redis 复制（全会的举个手看看）的更多相关文章

一文搞定Redis五大数据类型及应用场景
本文学习知识点 redis五大数据类型数据类型:string.hash.list.set.sorted_set 五大类型各自的应用场景 @TOC 1. string类型 1-1 string类型数据的 ...
一文搞定 SonarQube 接入 C#(.NET) 代码质量分析
1. 前言 C#语言接入Sonar代码静态扫描相较于Java.Python来说,相对麻烦一些.Sonar检测C#代码时需要预先编译,而且C#代码必须用MSbuid进行编译,如果需要使用SonarQub ...
一文搞懂vim复制粘贴
转载自本人独立博客https://liushiming.cn/2020/01/18/copy-and-paste-in-vim/ 概述复制粘贴是文本编辑最常用的功能,但是在vim中复制粘贴还是有点麻 ...
一文搞定MySQL的事务和隔离级别
一.事务简介事务是数据库管理系统执行过程中的一个逻辑单位,由一个有限的数据库操作序列构成. 一个数据库事务通常包含了一个序列的对数据库的读/写操作.它的存在包含有以下两个目的: 为数据库操作序列提供 ...
一文搞定scrapy爬取众多知名技术博客文章保存到本地数据库，包含：cnblog、csdn、51cto、itpub、jobbole、oschina等
本文旨在通过爬取一系列博客网站技术文章的实践,介绍一下scrapy这个python语言中强大的整站爬虫框架的使用.各位童鞋可不要用来干坏事哦,这些技术博客平台也是为了让我们大家更方便的交流.学习.提高 ...
搞懂Redis复制原理
前言与大多数db一样,Redis也提供了复制机制,以满足故障恢复和负载均衡等需求.复制也是Redis高可用的基础,哨兵和集群都是建立在复制基础上实现高可用的.复制不仅提高了整个系统的容错能力,还可以 ...
一文搞定Spring Boot + Vue 项目在Linux Mysql环境的部署（强烈建议收藏）
本文介绍Spring Boot.Vue .Vue Element编写的项目,在Linux下的部署,系统采用Mysql数据库.按照本文进行项目部署,不迷路. 1. 前言典型的软件开发,经过" ...
Spring Data Redis 详解及实战一文搞定
SDR - Spring Data Redis的简称. Spring Data Redis提供了从Spring应用程序轻松配置和访问Redis的功能.它提供了与商店互动的低级别和高级别抽象,使用户免受 ...
21.SpringCloud实战项目-后台题目类型功能（网关、跨域、路由问题一文搞定）
SpringCloud实战项目全套学习教程连载中 PassJava 学习教程简介 PassJava-Learning项目是PassJava(佳必过)项目的学习教程.对架构.业务.技术要点进行讲解. ...

随机推荐

怎么样写一个能告诉你npm包名字是否被占用的工具
事情是这样的: 因为我经常会写一些npm包,但是有时候我写完一个包,npm publish 的时候却被提示说包名字被占用了,要不就改名字,要不就加scope,很无奈.npm 命令行可以通过 npm v ...
linux系统标准目录及其内容
路径名操作系统内容 /bin 所有最核心的操作系统命令 /boot LS 内核和加载内核所需的文件 /dev 所有伪终端,磁盘,打印机等的设备项 /etc 所有关键的启动文件和配置文件 ...
9--RESTful支持
1.对url进行规范,写RESTful格式的url 非REST的url:http://...../queryItems.action?id=001&type=T01 REST的url风格:ht ...
BZOJ 1638 [Usaco2007 Mar]Cow Traffic 奶牛交通：记忆化搜索【图中边的经过次数】
题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=1638 题意: 给你一个有向图,n个点,m条有向边. 对于所有从入度为0的点到n的路径,找出 ...
css(4)
类选择器和id选择器都有父子选择器. 在css文件中国,有时候为了简化样式,可以把相同的样式拿出来放在一起. display:inline display:block 行内元素里只能放行内元素,而块内 ...
aop 例子(annotation方式实现)
面向切面编程(也叫面向方面),可以通过预编译方式和运行期动态代理实现在不修改源代码的情况下给程序动态统一添加功能的一种技术.AOP实际是GoF设计模式的延续,设计模式孜孜不倦追求的是调用者和被调用者之 ...
Posix线程编程指南(2)
这是一个关于Posix线程编程的专栏.作者在阐明概念的基础上,将向您详细讲述Posix线程库API.本文是第2篇将向您讲述线程的创建与取消. 一．概念及作用在单线程程序中,我们经常要用到"全 ...
1087 All Roads Lead to Rome (30)（30 分）
Indeed there are many different tourist routes from our city to Rome. You are supposed to find your ...
数据结构与算法（3）----->队列和栈
1. 栈和队列的基本性质栈是先进后出;(像是子弹夹,后进先打出) 队列是先进先出;(像是平时排队买冰淇淋,按顺序轮流) 栈和队列在实现的结构上可以有数组和链表两种形式; (1)数组结构实现容易; ( ...
误删除$ORACLE_HOME/dbs下的参数文件、密码文件，如何快速重建
[oracle@11g dbs]$ pwd/home/oracle/app/oracle/product/11.2.0/dbhome_1/dbs[oracle@11g dbs]$ lltotal 24 ...

一文搞定 Redis 复制（全会的举个手看看）

一文搞定 Redis 复制（全会的举个手看看）的更多相关文章

随机推荐

热门专题