0、Redis目录结构


1)Redis介绍及部署在CentOS7上(一)

2)Redis指令与数据结构(二)

3)Redis客户端连接以及持久化数据(三)

4)Redis高可用之主从复制实践(四)

5)Redis高可用之哨兵模式Sentinel配置与启动(五)

6)Redis高可用之集群配置(六)

一、介绍


  上一篇我们已经介绍了Redis的主从复制,传送门:《Redis高可用之主从复制实践(四)》,想必大家对redis已经有一个概念了,那么问题来了,如果redis主从复制的master服务器挂掉了,那么整体redis就崩溃了,因为master无法进行写数据,导致slave中无法更新数据。

那么为了解决这个问题我们就需要有一种方案让redis宕机后可以自动进行故障转移,还好redis给我们提供一种高可用解决方案 Redis-Sentinel。Redis-sentinel本身也是一个独立运行的进程,它能监控多个master-slave集群,发现master宕机后能进行自动切换。Sentinel可以监视任意多个主服务器

以及主服务器属下的从服务器,并在被监视的主服务器下线时,自动执行故障转移操作。

  既然有这么好的解决方案,那么我们就来看看如何在我们的服务器上进行配置

二、Sentinel配置启动与故障转移


1、环境配置

第一:准备3台服务器,此处我的sentinel就直接放在原先的服务器上

主机说明 主机IP 端口 sentinel端口
master

192.168.250.132

7000

26379

slave  192.168.250.133 7001 26380
slave  

192.168.250.134

7002

26381

此处要说明一个问题,我这边的sentinel采用的是集群部署的方式,而不是单点,想必大家也知道单点会存在很多的问题,比如:

1):当sentinel进程宕掉后(sentinel本身也有单点问题,single-point-of-failure)整个集群系统将无法按照预期的方式运行;

2):如果只有一个sentinel进程,如果这个进程运行出错,或者是网络堵塞,那么将无法实现redis集群的主备切换(单点问题)。

如果有多个sentinel,redis的客户端可以随意地连接任意一个sentinel来获得关于redis集群中的信息;即使有一些sentinel进程宕掉了,依然可以进行redis集群的主备切换;

2、创建sentinel配置文件

进入 132 服务器的redis文件夹下,我们创建一个文件名为 sentinel-26379.conf 配置文件,文件内容如下:

port
daemonize yes
logfile "26379.log"
dir "./"
sentinel monitor mymaster 192.168.250.132
sentinel down-after-milliseconds mymaster
sentinel parallel-syncs mymaster
sentinel failover-timeout mymaster
sentinel auth-pass mymaster
bind 192.168.250.132 127.0.0.1

那么133与134服务器下的redis文件夹中我们也创建相同的sentinel 配置文件,但主要修改一下端口26380/26381以及bin绑定的数据。

看到这里大家因为会对上面的配置有些疑惑,那我分别介绍一下参数的含义:

像 port、daemonize、logfile、dir、bind 这些我就不介绍了,之前也介绍过了,这边重点介绍一下sentinel的配置

sentinel monitor <master-name> <ip> <redis-port> <quorum>
告诉sentinel去监听地址为ip:port的一个master,这里的master-name可以自定义,quorum是一个数字,指明当有多少个sentinel认为一个master失效时,master才算真正失效

sentinel auth
-pass <master-name> <password>
设置连接master和slave时的密码,注意的是sentinel不能分别为master和slave设置不同的密码,因此master和slave的密码应该设置相同。 sentinel down-after-milliseconds <master-name> <milliseconds>
这个配置项指定了需要多少失效时间,一个master才会被这个sentinel主观地认为是不可用的。 单位是毫秒,默认为30秒 sentinel parallel-syncs <master-name> <numslaves> 
这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行 同步,这个数字越小,完成failover所需的时间就越长,但是如果这个数字越大,就意味着越 多的slave因为replication而不可用。可以通过将这个值设为  来保证每次只有一个slave 处于不能处理命令请求的状态。

sentinel failover
-timeout <master-name> <milliseconds>
failover-timeout 可以用在以下这些方面:    
. 同一个sentinel对同一个master两次failover之间的间隔时间。  
. 当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那里同步数据时。   
.当想要取消一个正在进行的failover所需要的时间。   
.当进行failover时,配置所有slaves指向新的master所需的最大时间。不过,即使过了这个超时,slaves依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来了。

配图如下:

这样子大家也能明白,那么接下来我们就要开始启动我们的sentinel啦,当然前提大家要先把redis主从复制开启。

sentinel 运行命令如下:

./src/redis-sentinel sentinel-.conf
./src/redis-sentinel sentinel-.conf
./src/redis-sentinel sentinel-.conf

运行完后我们再来看看sentinel-263779.conf的配置,发现配置文件被重写了,从内容可以看出有哪些slave和sentinel

内容已经配置完毕,现在我们进行一下故障转移吧,

3、故障转移

我们关闭master主节点,当然我演示的项目中master服务器是134,因为我之前有测试过,因此大家在操作的时候可以按照自己机器上的为主。

第一步:我们关闭134的redis,等待一会,我们再查看一下sentinel的日志。我们通过日志来分析一下自动故障转移的流程

=======================134master发现不能用
40325:X Jan ::09.920 # +sdown master mymaster 192.168.250.134 7002 =======================投票后有两个sentinel发现master不能用
:X Jan ::10.005 # +odown master mymaster 192.168.250.134 #quorum /2 =======================当前配置版本被更新
:X Jan ::10.005 # +new-epoch 2 =======================达到故障转移failover条件,正等待其他sentinel的选举
:X Jan ::10.005 # +try-failover master mymaster 192.168.250.134 7002 =======================进行投票选举slave服务器
:X Jan ::10.006 # +vote-for-leader 7985977d2db7df47bce251c06d50f77c3917d184
:X Jan ::10.007 # f53245a5100693311aeaf090b903de8587b3743a voted for 7985977d2db7df47bce251c06d50f77c3917d184
:X Jan ::10.008 # c8e067032a78eafcdca9636cb4d9777b492daea6 voted for 7985977d2db7df47bce251c06d50f77c3917d184
:X Jan ::10.077 # +elected-leader master mymaster 192.168.250.134
:X Jan ::10.077 # +failover-state-select-slave master mymaster 192.168.250.134 7002 =======================选择一个slave当选新的master
:X Jan ::10.178 # +selected-slave slave 192.168.250.132: 192.168.250.132 @ mymaster 192.168.250.134 7002 =======================把选举出来的slave进行身份master切换
:X Jan ::10.178 * +failover-state-send-slaveof-noone slave 192.168.250.132: 192.168.250.132 @ mymaster 192.168.250.134
:X Jan ::10.241 * +failover-state-wait-promotion slave 192.168.250.132: 192.168.250.132 @ mymaster 192.168.250.134
:X Jan ::10.393 # +promoted-slave slave 192.168.250.132: 192.168.250.132 @ mymaster 192.168.250.134 7002 =======================把故障转移failover改变reconf-slaves
:X Jan ::10.393 # +failover-state-reconf-slaves master mymaster 192.168.250.134 7002 =======================sentinel发送slaveof命令把133重新同步132master
:X Jan ::10.448 * +slave-reconf-sent slave 192.168.250.133: 192.168.250.133 @ mymaster 192.168.250.134 7002 =======================重写rewrite master地址到sentinel配置文件中
:X Jan ::10.738 * +sentinel-address-switch master mymaster 192.168.250.134 ip 192.168.250.132 port for c8e067032a78eafcdca9636cb4d9777b492daea6
:X Jan ::10.907 * +sentinel-address-switch master mymaster 192.168.250.134 ip 192.168.250.138 port for c8e067032a78eafcdca9636cb4d9777b492daea6 =======================离开不可用的master
:X Jan ::11.135 # -odown master mymaster 192.168.250.134 7002 =======================slave被重新配置为另外一个master的slave,但数据还未发生
:X Jan ::11.407 * +slave-reconf-inprog slave 192.168.250.133: 192.168.250.133 @ mymaster 192.168.250.134 7002 =======================与master进行数据同步
:X Jan ::11.407 * +slave-reconf-done slave 192.168.250.133: 192.168.250.133 @ mymaster 192.168.250.134 7002 =======================故障转移完成
:X Jan ::11.508 # +failover-end master mymaster 192.168.250.134 7002 =======================master地址发生改变
:X Jan ::11.508 # +switch-master mymaster 192.168.250.134 192.168.250.132 7000 =======================检测slave并添加到slave列表
:X Jan ::11.508 * +slave slave 192.168.250.133: 192.168.250.133 @ mymaster 192.168.250.132
:X Jan ::11.508 * +slave slave 192.168.250.134: 192.168.250.134 @ mymaster 192.168.250.132
:X Jan ::12.475 * +sentinel-address-switch master mymaster 192.168.250.132 ip 192.168.250.132 port for c8e067032a78eafcdca9636cb4d9777b492daea

自此故障转移完成,我们查看一下132,现在132已经变成master了,并且 133和134变为了slave。

我们再来对比一下 sentinel-26379.conf的配置文件数据,发现已经修改了。自此failover完成。

三、总结


redis的高可用已经讲解了两大部分了,剩余的集群部署将是我们的最后的步骤,也是关键的。下一篇将会开启集群的配置。

如果上述有问题,欢迎大家指教。

参考文章:

《Redis及其Sentinel配置项详细说明》:https://blog.csdn.net/a1282379904/article/details/52335051

Redis 复制、Sentinel的搭建和原理说明》:https://www.cnblogs.com/zhoujinyi/p/5570024.html

Redis Sentinel高可用架构》:https://www.cnblogs.com/gomysql/p/5040847.html

asp.net core 交流群:787464275 欢迎加群交流
如果您认为这篇文章还不错或者有所收获,您可以点击右下角的【推荐】按钮精神支持,因为这种支持是我继续写作,分享的最大动力!

作者:LouieGuo
声明:原创博客请在转载时保留原文链接或者在文章开头加上本人博客地址,如发现错误,欢迎批评指正。凡是转载于本人的文章,不能设置打赏功能,如有特殊需求请与本人联系!

微信公众号:欢迎关注                                                 QQ技术交流群: 欢迎加群

                

Redis高可用之哨兵模式Sentinel配置与启动(五)的更多相关文章

  1. Redis 高可用之哨兵模式

    参考   : https://mp.weixin.qq.com/s/Z-PyNgiqYrm0ZYg0r6MVeQ 一.redis高可用解决方案 redis主从 优点:1.高可靠性,主从实时备份,有效解 ...

  2. 老司机带你玩转面试(4):Redis 高可用之哨兵模式

    前文回顾 建议前面文章没看过的同学先看下前面的文章: 「老司机带你玩转面试(1):缓存中间件 Redis 基础知识以及数据持久化」 「老司机带你玩转面试(2):Redis 过期策略以及缓存雪崩.击穿. ...

  3. Redis学习三:Redis高可用之哨兵模式

    申明 本文章首发自本人公众号:壹枝花算不算浪漫,如若转载请标明来源! 感兴趣的小伙伴可关注个人公众号:壹枝花算不算浪漫 22.jpg 前言 Redis 的 Sentinel 系统用于管理多个 Redi ...

  4. Redis 高可用之哨兵模式(二)

    上一篇实际操作过程中遇到两个问题 问题一:虽然运行了3个sentinel容器,实际上只有一个sentinel运行 问题出现的原因很简单,三个sentinel用的是同一个挂载配置文件,容器内部的更改直接 ...

  5. Redis高可用方案-哨兵与集群

    Redis高可用方案 一.名词解释   二.主从复制 Redis主从复制模式可以将主节点的数据同步给从节点,从而保障当主节点不可达的情况下,从节点可以作为 后备顶上来,并且可以保障数据尽量不丢失(主从 ...

  6. Redis高可用方案哨兵机制------ 配置文件sentinel.conf详解

    Redis的哨兵机制是官方推荐的一种高可用(HA)方案,我们在使用Redis的主从结构时,如果主节点挂掉,这时是不能自动进行主备切换和通知客户端主节点下线的. Redis-Sentinel机制主要用三 ...

  7. redis高可用(哨兵机制)

    redis哨兵机制:redis的哨兵系统用于管理多个reids服务器,该系统主要有三个作用: 监控:哨兵 会不断地检查你的主服务(Master)和从服务器(Slave)是否运作正常. 提醒:当被监控的 ...

  8. Redis高可用-主从,哨兵,集群

    主从复制 Master-Slave主从概念 同时运行多个redis服务端,其中一个作为主(master),其他的一个或多个作为从(slave),主从之间通过网络进行通讯,slave通过复制master ...

  9. 老司机带你玩转面试(3):Redis 高可用之主从模式

    前文回顾 建议前面文章没看过的同学先看下前面的文章: 「老司机带你玩转面试(1):缓存中间件 Redis 基础知识以及数据持久化」 「老司机带你玩转面试(2):Redis 过期策略以及缓存雪崩.击穿. ...

随机推荐

  1. python高级特性和高阶函数

    python高级特性 1.集合的推导式 列表推导式,使用一句表达式构造一个新列表,可包含过滤.转换等操作. 语法:[exp for item in collection if codition] if ...

  2. ThreadLocal实现线程范围的共享变量

    一.如何理解线程范围内共享数据 1.static int num=0; 2.线程1访问num变量,并设置为num=2:线程2访问num变量,并设置为num=3: 3.当线程1中对象A.B.C 在访问线 ...

  3. Java面试题系列(一)描述一下JVM加载class文件的原理机制

    JVM系列第4讲:从源代码到机器码,发生了什么? https://www.cnblogs.com/chanshuyi/p/jvm_serial_04_from_source_code_to_machi ...

  4. javascript私有方法揭示为公有方法

    揭示模式可用于将私有方法暴露为公共方法.当为了对象的运转而将所有功能放置在一个对象中以及想尽可能地保护该对象,这种揭示模式就非常有用. 板栗: var myarray; (function(){ va ...

  5. systemd的电源管理

    ArchLinux早就使用systemd替代了init脚本. 不用图形界面.或者使用 i3.awesome 这样简单的窗口管理器时,systemd 可以替代 acpid 处理 ACPI 事件. 注意: ...

  6. Git Pull Failed: cannot lock ref 'refs/remotes/origin/xxxxxxxx': unable to resolve ref

    1.xxxxxxxx代表目录名称,我要pull的目录是supman_creditmall_v5: 2.从代码库中pull代码时报这个错误,代码pull失败: 3.解决办法,看下图,删除文件后再pull ...

  7. django+mysql安装和设置

    之前我们已经用sqlite建立了第一个web app.今天来学习如何在django中使用MySQL. 首先需要安装MySQL,到官网下载安装包:https://dev.mysql.com/downlo ...

  8. Spark笔记之Catalog

    一.什么是Catalog Spark SQL提供了执行sql语句的支持,sql语句是以表的方式组织使用数据的,而表本身是如何组织存储的呢,肯定是存在一些元数据之类的东西了,Catalog就是Spark ...

  9. [转]GCC系列: __attribute__((visibility("")))

    在 objc-api.h 里面有很多关于__attribute__ 的定义. 例如 #if !defined(OBJC_VISIBLE) # if TARGET_OS_WIN32 # if defin ...

  10. Servlet笔记9--转发与重定向

    关于Web中资源跳转的问题: 转发和重定向基本代码: package com.bjpowernode.javaweb; import java.io.IOException; import javax ...