第四章 Leader选举算法分析

　　Leader选举

　　学习leader选举算法，主要是从选举概述，算法分析与源码分析（后续章节写）三个方面进行。

　　Leader选举概述

　　服务器启动时期的Leader选举

　　选举的隐式条件便是ZooKeeper的集群规模至少是2台机器，以3台机器组成的服务器集群为例。在服务器集群初始化阶段，当有一台服务器（myid为1,称为Server1）启动的时候，无法完成Leader选举。第二台机器（myid为2,称其为Server2)也启动后，此时这两台机器已经能够进行互相通信，每台机器都试图找到一个Leader,干是便进入了 Leader选举流程。

　　1.每个Server会发出一个投票。

　　初试启动时，Serverl和Server2都选举自己为leader，每次投票包含的最基本的元素包括：所推举的服务器的myid和ZXID，以（myid， ZX1D)的形式来表示。即Serverl的投票为（1, 0)， Server2的投票为（2, 0)，然后各自将这个投票发给集群中其他所有机器。

　　2. 接收来自各个服务器的投票。

　　集群中的每个服务器在接收到投票后，首先会判断该投票的有效性，包括检查是否是本轮投票、是否来自LOOKING状态的服务器。

　　3. 处理投票。

　　针对收到的每一张选票，都需要将別人的投票和自己的投票进行PK， PK的规则如下：

　　　　a.首先比较ZXID。 ZXID大的选票胜出。

　　　　b.当ZXID相同时，myid大的选票胜出。
　　对于Server1来说，初试投票是(1,0) ,接收到的投票为(2,0)。两者的ZXID都是0,对比两者的myid, Server1接收到的投票中的myid是2,大于自己，于是就会更新自己的投票为（2,0)，然后重新将投票发出去。对于Server2来说，不需要更新自己的投票信息，只是再一次向集群中所有机器发出上一次投票信息。
　　4. 统计投票。
　　每次投票后，服务器都会统计所有投票，如果一台机器收到超过半数的相同的投票，那么这个投票对应的SID机器即成为Leader。对于Server1和Server2服务器来说，都统计收到（2, 0)这个投票信息两票。

　　5. 改变服务器状态。

　　服务器运行期间的Leader选举

　　当leader所在的机器挂了，整个集群将暂时无法对外提供服务，集群进入新一轮的leader选举。服务器运行期间的Leader选举和启动时期的Leader选举基本过程是一致。假设当前正在运行的ZooKeeper服务器由3台机器组成，分别是Server1、 Server2和Server3,当前的Leader是Server2,在某一个瞬间， Leader挂了。

　　1.变更状态

　　Follower将状态变更为LOOKING

　　2.每个Server发出一个投票　　　　

　　假定Served的ZXID为123 ,而Server3的ZXID为122。在第一轮投票中， Server1和Server3都会投自己，即分别产生投票（1,123）和（3， 122）,然后各自将这个投票发给集群中所有机器。

　　3. 接收来自各个服务器的投票。

　　4.处理投票

　　根据选票PK规则，server1的投票胜出。Server3将自己的选票变更为（1,123）重新投出。

　　5.统计投票

　　6.改变服务器状态

　　算法分析

　　在ZooKeeper中，提供了三种Leader选举的算法，分别是LeaderElection'、UDP版本的FastLeaderElection 和 TCP 版本的 FastLeaderElection，可以通过在配置文件 zoo.cfg中使用electionAlg属性来指定，分别使用数字0~3来表示。0代表LeaderElection,这是一种纯UDP实现的Leader选举算法；1代表UDP版本的FastLeaderElection,并且是非授权模式； 2也代表UDP版本的FastLeaderElection,但使用授权模式；3代表TCP版本的FastLeaderElection。从3.4.0版本开始， ZooKeeper废弃了 0、1和2这三种Leader选举算法，只保留了 TCP版本的FastLeaderElection选举算法。

　　关于进入Leader选举

　　当ZooKeeper集群中的一台服务器出现以下两种情况之一时，就会开始进人Leader选举。
　　　　a.服务器初始化启动。
　　　　b.服务器运行期间无法和Leader保持连接。
　　当一台机器进人Leader选举流程时，当前集群也可能会处于以下两种状态。
　　　　a.集群中本来就已经存在一个Leader。
　　　　b.集群中确实不存在Leader。

　　第一种已经存在Leader的情况通常是集群中的某一台机器启动比较晚，在它启动之前，集群已经可以正常工作，即已经存在了一台Leader服务器。针

对这种情况，当该机器试图去选举Leader的时候，会被告知当前服务器的Leader信息，对于该机器来说，仅仅需要和Leader机器建立起连接，并进行状态同步即可。

　　关于变更选票

　　集群中的每台机器发出自己的投票后，也会接收到来自集群中其他机器的投票。每台机器都会根据一定的规则，来处理收到的其他机器的投票，并以此来决定是否需要变更自己的投票。这个规则也成为了整个Leader选举算法的核心所在。

　　• vote_sid:接收到的投票中所推举Leader服务器的SID。
　　• vote_zxid:接收到的投票中所推举Leader服务器的ZXID。
　　• self_sid:当前服务器自己的SID。
　　• self_zxid:当前服务器自己的ZXID。
　　每次对干收到的投票的处理，都是一个对(vote_sid, vote_zxid)和(self_sid,self_zxid)对比的过程。
　　• 规则 1 : 如果 vote_zxid大于self_zxid，认可当前收到的投票，并再次将该投票发送出去。
　　• 规则 2 : 如果 vote_zxid小于self_zxid,那么就坚持自己的投票，不做任何变更。
　　• 规则 3 : 如果 vote_zxid等于self_zxid,那么就对比两者的SID。如果vote_sid大于self_sid，那么就认可当前接收到的投票，并再次将该投票发送出去。
　　• 规则 4 : 如果 vote_zxid等于self_zxid, 并且 vote_sid小于self_sid,那么同样坚持自己的投票，不做变更。

第四章 Leader选举算法分析的更多相关文章

ZOOKEEPER3.3.3源码分析(四)对LEADER选举过程分析的纠正
很抱歉,之前分析的zookeeper leader选举算法有误,特此更正说明. 那里面最大的错误在于,leader选举其实不是在大多数节点通过就能选举上的,这一点与传统的paxos算法不同,因为如果这 ...
Zookeeper入门(四)之Leader选举
让我们分析如何在ZooKeeper集合中选举leader节点.考虑一个集群中有N个节点.leader选举的过程如下: 所有节点创建具有相同路径 /app/leader_election/guid_ 的 ...
【分布式】Zookeeper的Leader选举
一.前言前面学习了Zookeeper服务端的相关细节,其中对于集群启动而言,很重要的一部分就是Leader选举,接着就开始深入学习Leader选举. 二.Leader选举 2.1 Leader选举概 ...
《从Paxos到ZooKeeper 分布式一致性原理与实践》阅读【Leader选举】
从3.4.0版本开始,zookeeper废弃了0.1.2这3种Leader选举算法,只保留了TCP版本的FastLeaderElection选举算法. 当ZooKeeper集群中的一台服务器出现以下两 ...
Zookeeper系列（十一）zookeeper的Leader选举详解（核心之一）
作者:leesf 掌控之中,才会成功:掌控之外,注定失败. 出处:http://www.cnblogs.com/leesf456/p/6107600.html尊重原创,奇文共欣赏: 一.前言前 ...
【分布式】Zookeeper的Leader选举-选举过程介绍(经典的Paxos算法解析)
一.前言前面学习了Zookeeper服务端的相关细节,其中对于集群启动而言,很重要的一部分就是Leader选举,接着就开始深入学习Leader选举. 二.Leader选举 2.1 Leader选举概 ...
zookeeper集群搭建及Leader选举算法源码解析
第一章.zookeeper概述一.zookeeper 简介 zookeeper 是一个开源的分布式应用程序协调服务器,是 Hadoop 的重要组件. zooKeeper 是一个分布式的,开放源码的分 ...
面试官：Redis集群有哪些方式，Leader选举又是什么原理呢？
哈喽!大家好,我是小奇,一位不靠谱的程序员小奇打算以轻松幽默的对话方式来分享一些技术,如果你觉得通过小奇的文章学到了东西,那就给小奇一个赞吧文章持续更新一.前言作为一名Java程序员,Redi ...
Zookeeper-Zookeeper leader选举
在上一篇文章中我们大致浏览了zookeeper的启动过程,并且提到在Zookeeper的启动过程中leader选举是非常重要而且最复杂的一个环节.那么什么是leader选举呢?zookeeper为什么 ...

随机推荐

面对一个新的MCU，我再也不敢说第一步是点灯了
折腾了几天AT91SAM3S,今天才算是把开发板上的3个LED点亮. 在点亮之前,起码看了百八十页的Datasheet,动用了N次百度. 各种时钟,看门狗,分散加载,中断向量,都得去整.这些都远远超过 ...
Storm Topology及分组原理
Storm的通信机制,需要满足如下一些条件以满足Storm的语义. 1.建立数据传输的缓冲区.在通信连接没有建立之前把发送的数据缓存起来.数据发送方可以在连接建立之前发送消息,而不需要等连接建立起来, ...
Unity5版本的AssetBundle打包方案之打包Scene场景
using UnityEngine; using System.Collections; using UnityEditor; /// <summary> /// 脚本位置:Editor文 ...
Linux下*.tar.gz文件解压缩命令
1.压缩命令: 命令格式:tar -zcvf 压缩文件名.tar.gz 被压缩文件名可先切换到当前目录下.压缩文件名和被压缩文件名都可加入路径. 2.解压缩命令: 命令格式:tar -z ...
Django进阶篇（一）
Form django中的Form一般有两种功能: 1.输入html 2.验证用户输入最简易的form验证: <!DOCTYPE html> <html lang="en ...
ios开发 iphone中获取网卡地址和ip地址
这是获取网卡的硬件地址的代码,如果无法编译通过,记得把下面的这几个头文件加上把. #include <sys/socket.h> // Per msqr#include <sys/s ...
DataGridView控件的各种操作总结
一.单元格内容的操作 *****// 取得当前单元格内容 Console.WriteLine(DataGridView1.CurrentCell.Value); // 取得当前单元格的列 Index ...
Show "Appear Offline" in Lync
在注册表中 HKEY_LOCAL_MACHINE\SOFTWARE\Policies\Microsoft\Communicator 创建DWORD,name是EnableAppearOffline,v ...
去块率波 Deblocking filter
基于块的视频编码的一个典型特点就是在图像中会出现偶发的可察觉的块结构,这是由于重构块的边缘像素与块内部像素相比恢复精度要低,块效应是目前压缩编码最明显的视觉失真之一.在H.264/ AVC视频编码标准 ...
Android.mk的用法和基础【转】
一个Android.mk file用来向编译系统描述你的源代码.具体来说:该文件是GNU Makefile的一小部分,会被编译系统解析一次或多次.你可以在每一个Android.mk file中定义一个 ...

第四章 Leader选举算法分析

第四章 Leader选举算法分析的更多相关文章

随机推荐

热门专题