【分布式协调器】Paxos的工程实现-Cocklebur状态转移
集群中的主机经过选举过程由Looking状态变为了Leadering或Following状态。而这些状态之间转移的条件是什么呢?先来个直观的,上状态图。
图 4.1 Cocklebur选举过程中的状态图
接下来我们对上面的状态图进行逐个分析,并且做出简要的解释说明。如果你对一些概念有所遗忘,请查阅“Cocklebur选举”一章中的名词解释。
Cocklebur状态转义描述
表 4-1 状态转移链接表
状态转移链接 |
条件 |
解释 |
Start->Looking |
启动 |
主机进程实例一旦被启动都设置为Looking状态 |
Looking->Following |
收到对自己加ACK锁主机的Lead消息,或者确定已经存在一个稳定的正常工作的多数派 |
发现之前给自己加ACK锁的候选者已经成为Leader,说明一定存在一个多数派以其作为Leader,故可以变为Following。另外当一个Looker发现已经存在一个稳定的服务集群(有稳定的Leader和Follower),则它会自动变为Follower加入集群 |
Looking->Leadering |
获得多数派的ACK锁 |
改进段属于Paxos的第二阶段,候选者赢得了多数派(包括自己)的投票,那么他就多数派申请ACK锁,如果应答允许的节点依然可构成多数派,则说明候选者可以做为Leader |
Following->Looking |
Leader状态改变为非Leadering或向Leader申请租约超时 |
当发现Leader已经不是Leader,或者在超时内连接不到Leader,那么说明Leader已经失效,则需要重新选举 |
Leadering->Looking |
租约有效的Follower不足majority-1 |
Leader维护这租约表,如果有效的Follower不少于majority-1,那么算上Leader自己可构成多数派。如果不满足此条件,则重新选举 |
*->end |
宕机 |
主机宕机,任何状态归于结束 |
状态转移控制流程在源码的Cocklebur.cpp中的process方法中,只用到了一个switch语句。lookForLeader()、Following()、Leadering(),这三个方法完成了三态的运行流程,而每一个方法结束之前,已经确保了全局状态是否改变,这样在某个方法结束后,process方法就可以直接运行当前状态应该运行的控制流程。
lookForLeader()的算法逻辑我们已经在选举一章中分析过,接下来介绍一下Following()、Leadering()两个方法。这两个方法分别属于Follower对象与Leader对象。
Follower的实现
Follower每隔一段时间向Leader申请租约。所谓申请租约本质上是一种超时锁,而Follower申请的像是一种读锁,拥有租约之后Follower才能保证能从Leader同步到最新数据。Follower通过心跳的方式向Leader发送一个消息,Cocklebur中消息的结构如下:
struct HBMSG {
1: string my_host_name,
2: i32 cur_node_mode,
3: i64 xid,
}
这是使用thrift脚本格式去定义的结构体,它包含三个部分:消息发送者的主机名my_host_name、当前状态cur_node_mode、发送者的数据版本xid。
Follower根据配置定时向Leader发送一个HBMSG,同时也接收一个Leader返回的HBMSG。如果发现返回的HBMSG中Leader状态已经改变,那么它将结束Following流程。Follower的Client实现了一种超时机制,如果连接超时,HBMSG的my_host_name将被置为空串,这说明Leader失效,那么也将结束Following流程。
而xid的作用就是告知Follower与Leader双方是否需要同步数据。如果Follower发现数据版本xid小于Leader,并且Follower接到Client的同步(sync方法的调用)请求,那么则可以主动的去Leader同步。一般情况下Follower的xid可能会小于Leader一段时间,因为向Follower推送数据是Leader主动完成的。
当集群刚刚选举完毕,Leader往往还不会对外提供读写服务,因为Cocklebur认为在对外服务之前还有可能加入xid更大的Follower。那么此时Leader便会主动的去pull数据。也就是说Follower只有在client请求其向Leader同步时,Follower才会pull数据。
Leader的实现
Leader刚刚进入Leadering状态时会为每个多数派其他成员初始化一个租约列表,每个成员的租约期限有个默认值。之后就是不停的去减少租约表中的租约。如果接到了某个Follower申请租约的请求,Leader会为其重新审定租约期限。租约表就好像是一排沙漏,不停的漏沙子,而Follower按照一定时间间隔往自己漏斗中填一把沙子,保证不漏光。如果漏光了,那么Leader则会将其拿掉。如果有新的Follower加入,Leader则为其申请一个新的租约计时器。
当租约表中的Follower与自己构不成一个多数派时,Leader将会退出Leadering流程。当然这里面可以对一些超时选项加以配置。比如租约表为空之后可以不立即退出,租约被申请多次之后可以提高租约期限等等。
上文中提到了Leader在决定是否要对外服务之前同步数据的问题。选举完成后,Leader不马上让集群对外服务,而是等待一段时间看看时候还有新的Follower加入。如果这期间加入了Follower,Leader会轮流对其监察(通过HBMSG的方式),若检查发现xid比自己的大,则开始pull数据。数据操作后文会逐渐讲解。
最后大家可能会有一些疑问,Xid较大,一定代表他数据最新且正确吗?其实在进行同步时Leader会有一些机制去监察数据是否是正确的,整个集群在写数据时每个操作都记录在日志中,在任何时候集群中的每个节点都是一个状态机,只要经历的步骤顺序正确,那么一定可以保证xid的正确性(经历有限相同状态转移之后状态一致)。该部分也将会在后文中阐述。
【分布式协调器】Paxos的工程实现-Cocklebur状态转移的更多相关文章
- 【分布式协调器】Paxos的工程实现-cocklebur简介(一)
初识分布式协调器 分布式协调器的“协调”二字让人摸不到头脑,怎么就协调了,用的着协调吗?实际上这个东西在之前就是为了提供分布式锁服务而设计的,伟大的google公司发明了chubby,雅虎随后也推出了 ...
- 中小研发团队架构实践之分布式协调器.Net版ZooKeeper
原文:中小研发团队架构实践之分布式协调器.Net版ZooKeeper 一.ZooKeeper是什么 Apache ZooKeeper是由Apache Hadoop的子项目发展而来,于2010年11月 ...
- 【分布式协调器】Paxos的工程实现-cocklebur简介(二)
Cocklebur集群的工作原理 在集群正常工作时,整个集群只会有一个Leader,其他都是Follower.Client可以注册到某个Follower,当然也可以注册到Leader,为了减轻Lead ...
- 中小研发团队架构实践之分布式协调器ZooKeeper
一.ZooKeeper是什么 Apache ZooKeeper是由Apache Hadoop的子项目发展而来,于2010年11月正式成为了Apache的顶级项目. ZooKeeper是一个开放源代码 ...
- 【分布式协调器】Paxos的工程实现-cocklebur选举
其实整个项目中一个最主要的看点就是选举算法,而这部分也是逻辑最复杂最难理解的部分.不同的实现在不同的场景下的策略也不尽相同,而且场景非常之多.接下来我们一起来看一下Cocklebur的实现思路. 一个 ...
- 中小型研发团队架构实践:分布式协调服务ZooKeeper
一.ZooKeeper 是什么 Apache ZooKeeper 由 Apache Hadoop 的子项目发展而来,于 2010 年 11 月正式成为了 Apache 的顶级项目. 相关厂商内容 优秀 ...
- 【分布式协调】之理解paxos
感叹一下 不得不说近几年国内软件行业发生了巨大的变化,之前几乎所有应用都围绕桌面展开,而近几年很多让人神魂颠倒的关键词一个接一个的映入眼帘:web2.0.移动应用.云计算.大数据.互联网的浪潮一波接着 ...
- SqlServer & Windows 可更新订阅立即更新启用分布式事务协调器(MSDTC)
原文:SqlServer & Windows 可更新订阅立即更新启用分布式事务协调器(MSDTC) 在可更新订阅中,在订阅设置更新方法,将 "排队更新" 设置为 " ...
- 分布式系列文章——Paxos算法原理与推导
Paxos算法在分布式领域具有非常重要的地位.但是Paxos算法有两个比较明显的缺点:1.难以理解 2.工程实现更难. 网上有很多讲解Paxos算法的文章,但是质量参差不齐.看了很多关于Paxos的资 ...
随机推荐
- EF深入系列--细节
1.在调试的时候,查看EF生成的SQL语句 在Context类的构造函数中添加以下代码,就可以在调试的时候在[输出]窗口中看到SQL语句 this.Database.Log = s => Sys ...
- JSON字符串和Dictionary字典类型的相互转换
在开发过程中,往往会遇到数据类型转换的情况,根据自己的业务,可能转换类型有多种,下面就说一下json字符串和字典类型的转换. public static class JsonUntity { /// ...
- 查询数据过多页面反应慢引入缓存解决方案(Redis、H2)
问题:原系统查询接口不支持分页也不可能加入分页支持,导致Ajax查询数据过多,返回数据达到2W多条记录时响应已经极慢,查询功能不要求数据实时性,页面反应速度极慢.体验不好:经排查是由于数据量过大导 ...
- 双核CPU,跑程序会报rcu_sched_state detected stalls on CPUs/tasks 错误
有一份SDK,之前跑在PPC405EX上没问题。最近换平台,CPU使用了PowerPC的P1020,双核。linux版本也升级到了3.0.48版本。升级之后出现了一个问题:SDK里面的程序跑一段时间之 ...
- Eclipse中启动tomcat报错:A child container failed during start
我真的很崩溃,先是workspace崩了,费了好久重建的workspace,然后建立了一个小demo项目,tomcat中启动却报错,挑选其中比较重要的2条信息如下: A child container ...
- git错误:Target branch can't be blank
一.问题描述 遇到一个问题:Target branch can't be blank 因为问题再没有重现,所以拿一张网上的图: 情况是,比如a是项目的owner,有一个项目a/Project. b从a ...
- [转]oracle中使用set transaction设置事务属性
本文转自:http://yedward.net/?id=24 set transaction语句允许开始一个只读或者只写的事务,建立隔离级别或者是为当前的事务分配一个特定的回滚段.需要注意的是,set ...
- Openxml入门---Openxm读取Excel数据
Openxml读取Excel数据: 有些问题,如果当Cell 里面是 日期和浮点型的话,对应的Cell.DataType==Null,对应的时间会转换为一个浮点型,对于这块可以通过DateTime.F ...
- MMORPG大型游戏设计与开发(part1 of net)
网络模块的设计,是大型多人在线游戏中比较重要的一部分.我之所以将网络模块放到最前面,是因为许许多多的开发者面对这一块的时候充满了疑惑,而且也觉得很神秘和深奥.这些我们面对到的困难,其实是由于我们对这方 ...
- 使用dedecms中常见错误提示及解决办法(一)
在使用 dedecms 做网站时,常常会遇到一些棘手的问题,比如:页面图片不显示(src 的地址不对)等等. 1. 更新网站时错误 问题:Call to a member function GetIn ...