前言

这次我们来说说,有关于etcd原理的一些事情。之前我们已经了解到了etcd是一个分布式的k-v存储,那么它究竟是如何保证数据是如何复制到每个节点上面去的呢?又是如何保证在网络分区的情况下能正常工作下去?raft协议到底是什么?带着这些问题我们继续往下看。

raft选举策略

我们知道etcd使用raft协议来保证整个分布式的节点网络能正常的运转并且能正确的将数据复制到每个节点上面去。那么什么是raft协议嘞?

首先我们有这样一个背景:raft是想维护整一个网络,其中有一个领导人,这个领导人负责将收到的信息同步给网络中的其他所有节点,从而保证整个网络数据一致。

如果你有一定的英文基础,我建议直接查看下面这个网站,它用动画非常清楚的描述了raft选举的整个过程:http://thesecretlivesofdata.com/raft/

这个其实已经说明的超级棒了,如果你还看不懂,我下面会用最简单的几个要点来进行最简单的说明。

大多数理论

首先说明一个理论,叫做大多数理论,很简单,举个栗子:

  • 有10个人,如果你将苹果给其中的6个人(大多数),那么你随机选择5个人,一定有一个人会有苹果。

在etcd中的应用:

  • 选举中只要有大多数(超过半数的人给你投票)你肯定就是票数最多的了,不可能有人比你更多。
  • 只需要将日志复制给大多数的节点,那么只要有一半的节点正常工作就能保证数据最新

选举状态

下面是一些选举过程中节点的状态
leader 表示选举最终产生的领导人
candidate 候选状态,表示当前正在参与选举
follower 表示选举最终自己不是领导人,那自己就是从属节点

选举过程与要点

  1. 所有节点一开始都是follower状态
  2. 当节点处于follower状态时,每个节点随机经过一段时间,如果没有收到leader的消息就会进入candidate状态(证明当前没有leader节点需要重新进行选举),如果收到信息就会继续保持follower状态
  3. 当节点处于candidate就会要求别人给自己投票,收到大多数的节点的投票那就转变为leader状态,否则要么是别的节点成为了leader,要么就是因为特殊情况导致这次选举失败重新进行选举
  4. 每次选举举办的时候有一个term,在每一个term中,每个节点只能投票一次
  5. 投票的时候必须投给当前数据至少和自己一样的节点,并且term大的优先

日志复制规则

etcd是通过日志复制来实现数据同步的

这个图网上也很多,说明的是日志复制的规则
每个节点都有一份自己的日志,有的节点多,有的节点少,日志最多的肯定是leader。
上图还有几个要点,我看别人没提到,我就提一下:

  1. 颜色代表term
  2. 第四行表示的这个节点,第一term下复制了两个日志就异常挂掉了
  3. 最终只有第三行这个follower和第一行的leader保持了同步

异常情况

raft之所以厉害因为即使出现一些特殊情况,整个网络在一定的时间之后也能自动恢复并正常工作。

一个节点的异常

首先最常见的情况就是一个节点出现异常,有可能是这个节点的服务器挂了,或者别的什么原因。

  • 如果出现问题的这个节点是follower,那么没有关系,整个网络依旧能正常运行,当这个节点再次加入网络的时候也只需要同步后面的数据即可。
  • 如果出现问题的是leader,有一点麻烦,因为网络中没有leader节点了,那么就会重新进行选举,重新找一个leader,当这个异常节点恢复之后发现当前网络中有leader了,而且term还比自己大,那么自己就退位称为follower。

网络分区

还有一种异常情况是由于网络导致的,网络出现异常,导致节点之间的通信存在异常,一部分节点与另一部分之间没有办法访问了。如下图所示:

上面三个follower没有办法与下面的节点进行通信。

  • 当客户端再次请求leader发送数据的时候,leader发现没有办法将数据同步给给大多数节点,它只能给自己和旁边的一个,此时leader没有办法给客户端反馈。
  • 上面三个节点由于收不到leader的消息,那么会认为网络中没有leader存在,会重新进行选举操作,因为当前上面有三个节点存在(只要有超过半数的节点参与选举就行),所以可以重新选举成功,选出新的leader告诉客户端,客户端就会重新发送数据到新的leader。
  • 当网络恢复之后又会找到最新的leader从而将数据同步至最新的状态。

总结

总的来说,只要整个网络中存在大多数节点正常运行,那么etcd就是可用的,并且能够保证数据正确。当网络恢复之后也能将数据调整到最新的状态。
raft强大的地方在于它能自动的进行状态的变化,自动进行选举,并且选举遵循一定的策略,进而保证整个网络的正常运转。同时保证数据的一致性。
了解etcd的这个原理有助于我们后续的使用以及源码的阅读。

浅入深出ETCD之【raft原理】的更多相关文章

  1. 浅入深出ETCD之【简介与命令行使用】

    前言 你知道etcd吗?随着k8s的使用广泛之后,etcd被非常多的人所知道,同时又因为它可靠的分布式特性被很多人喜欢.所以,我准备有几篇博文来记录一下,从基本使用到线上部署再到原理分析,做一个系列. ...

  2. 浅入深出ETCD之【集群部署与golang客户端使用】

    前言 之前说了etcd的简介,命令行使用,一些基本原理.这次来说说现实一点的集群部署和golang版本的客户端使用.因为在实际使用过程中,etcd的节点肯定是需要2N+1个进行部署的,所以有必要说明一 ...

  3. 浅入深出之Java集合框架(下)

    Java中的集合框架(下) 由于Java中的集合框架的内容比较多,在这里分为三个部分介绍Java的集合框架,内容是从浅到深,哈哈这篇其实也还是基础,惊不惊喜意不意外 ̄▽ ̄ 写文真的好累,懒得写了.. ...

  4. 『浅入深出』MySQL 中事务的实现

    在关系型数据库中,事务的重要性不言而喻,只要对数据库稍有了解的人都知道事务具有 ACID 四个基本属性,而我们不知道的可能就是数据库是如何实现这四个属性的:在这篇文章中,我们将对事务的实现进行分析,尝 ...

  5. 浅入深出之Java集合框架(上)

    Java中的集合框架(上) 由于Java中的集合框架的内容比较多,在这里分为三个部分介绍Java的集合框架,内容是从浅到深,如果已经有java基础的小伙伴可以直接跳到<浅入深出之Java集合框架 ...

  6. 浅入深出之Java集合框架(中)

    Java中的集合框架(中) 由于Java中的集合框架的内容比较多,在这里分为三个部分介绍Java的集合框架,内容是从浅到深,如果已经有java基础的小伙伴可以直接跳到<浅入深出之Java集合框架 ...

  7. 浅入深出Vue:环境搭建

    浅入深出Vue:环境搭建 工欲善其事必先利其器,该搭建我们的环境了. 安装NPM 所有工具的下载地址都可以在导航篇中找到,这里我们下载的是最新版本的NodeJS Windows安装程序 下载下来后,直 ...

  8. 浅入深出Vue:工具准备之PostMan安装配置及Mock服务配置

    浅入深出Vue之工具准备(二):PostMan安装配置 由于家中有事,文章没顾得上.在此说声抱歉,这是工具准备的最后一章. 接下来就是开始环境搭建了~尽情期待 工欲善其事必先利其器,让我们先做好准备工 ...

  9. 浅入深出Vue:工具准备之WebStorm安装配置

    浅入深出Vue之工具准备(一):WebStorm安装配置 工欲善其事必先利其器,让我们先做好准备工作吧 导航篇 WebStorm安装配置 所有工具的下载地址都可以在导航篇中找到,这里我们下载的是最新版 ...

随机推荐

  1. Linux errno 与 Python

    以下均为Linux环境测试. 起因: 开发的一个程序,经常会由于内存不足而被kill掉,使用的是os.system函数执行的,返回值总是35072,当时没多想.后来由于一些原因,要模拟OOM 被kil ...

  2. 【Nginx】将http升级到https并且同时支持http和https两种请求

    一.如何将http升级到https 需要满足下面三个: 1.域名 2.nginx 3.SSL证书     一般第三方证书颁发机构下发的证书是收费的,一年好几千.    1) 从腾讯云申请免费的SSL证 ...

  3. 【异常】微博生成短链异常{"request":"/2/short_url/shorten.json","error_code":"10014","error":"Insufficient app permissions!"}

    一.之前的调用方式 这种方式用了大约有一年时间,之前没有问题,但是2019-8-28号突然不行了,可能是由于微博对该接口的调用做了限制.不允许通过传递source参数的方式进行请求 该接口微博API文 ...

  4. jmeter 使用命令行执行

    一般情况我们在设计脚本的时候,可以使用界面执行. 实际在压测的时候,我们可以使用命令行在后台执行. jmeter -n -t D:\document\bgy\jemeter\Script1.jmx - ...

  5. Socket网络编程-TCP编程

    Socket网络编程-TCP编程 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.socket介绍 1>.TCP/IP协议 2>.跨网络的主机间通讯 在建立通信连接的 ...

  6. SQL注入之Sqlmap使用

    我们都知道,对于网络渗透最重要的一步是要拿到后台数据库管理员的密码与用户名,那么怎么得到这个用户名和密码呢?就要用到今天所说的Sqlmap,它不仅适用于内网环境,在外网环境也是非常受欢迎的,并且在Ka ...

  7. 石子合并问题--直线版 HRBUST - 1818

    t题目链接:https://vjudge.net/problem/HRBUST-1818 思路:一段已经合并的区间,分成两段区间,遍历所有能分开的区间. 代码有注释,基本就这样一个简单是思路. #in ...

  8. PAT 乙级 1022.D进制的A+B C++/Java

    1022 D进制的A+B (20 分) 题目来源 输入两个非负 10 进制整数 A 和 B (≤),输出 A+B 的 D (1)进制数. 输入格式: 输入在一行中依次给出 3 个整数 A.B 和 D. ...

  9. python应用-输入三个数,输出其最大值

    """ 输入三个数,输出其最大值 Author:罗万财 Date:2017-7-6 """ a=int(input('a=')) b=int ...

  10. 利用反射与dom4j读取javabean生成对应XML

    项目中需要自定义生成一个xml,要把Javabean中的属性拼接一个xml,例如要生成以下xml <?xml version="1.0" encoding="gb2 ...