聊完kafka必不可少的需要再聊一聊zk了,下面开始

一、ZK是什么

ZooKeeper是分布式应用程序的高性能协调服务。它可以实现分布式的选主、统一配置管理,命名,分布式节点同步,分布式锁等分布式常用功能;它以path节点的形式保存数据,每个节点都可以存储数据,因为ZK只是分布式的协调者而不推荐做数据库,所以需要减少没必要的写操作,确保对外提供的服务高效、快速,因此其节点的最大容量限制为1M;

1、ZK的节点类型

  • 持久节点 即客户端创建后不会随着客户端的下线而消失,会一直存在;
  • 临时节点 即随着客户端的下线而被删除;这里需要说下的是,zk会给每个客户端创建一个session,且该session是会同步到集群其他节点的;

2、ZK的几个特征

  • 顺序一致性 ===> 即客户端的更新将按发送顺序执行
  • 原子性 ===> 即更新要么成功要么失败,没有中间状态
  • 统一视图 ===> 无论连接到哪个服务器,客户端都将看到相同的服务视图,即集群内各节点对外展示的视图统一不会有偏差
  • 可靠性 ===> 节点更新以后在下次操作它之前,该节点的数据不会发生变更
  • 及时性 ===> 集群对外提供的客户视图保证在特定时间范围内是最新的,可以理解成最终一致性,某个节点发生编号后会在特定时间内同步到集群其他节点,这也呼应了统一视图的特征

3、常用命令

  • create [-s] [-e] path data

    -s 可选,表示创建的是序列节点,会给节点编号,可以在分布式集群环境下保证向同一个节点写入数据的安全性(不被覆盖)

    -e 可选,表示创建的是临时节点

    path 必填,表示期望创建的节点路径

    data 必填,表示期望存储的数据,需要注意的是如果不用存数据该参数也不可缺省,可用""代替
  • get path

    获取path路径下的子节点信息
  • set path data

    设置path下存储的值
  • delete path

    删除path
  • sync path

    获取path下集群一致性达成后的最终数据,即如果请求的是非leader节点需同步向leader请求数据

二、ZK的集群

zk是主从复制集群,一个leader多个follower,只有leader能写,其余节点只提供读功能,但是客户端是可以连接集群中任意节点的,当连接的是leader则直接写,当连接的是follower则会被转发到leader进行写操作;zk集群分为两种状态,一种为leader存活的可用状态,另一种为leader挂了的不可用状态(无主);当集群处于不可用状态即leader下线时,分为两种情况,一种是剩余存活节点的个数满足过半选举条件,此时会进行选主操作,过半通过即产生新的leader集群恢复成可用状态;另一种是剩余存活节点数不满足过半选举条件,如leader挂了后集群只剩两台机子了,这样会出现脑裂问题,会导致选主失败整个集群仍会处于不可用状态。需要注意的是第二种选主失败集群不可用的情况下,只是集群对外不可用,对应存活实例的进程仍然存在,直到有新的服务上线满足选主条件,从而使集群快速恢复到可用状态;下面通过图示直观展现:

集群间数据同步问题

zk集群由leader负责数据的增改操作,那么leader的数据同步到集群各节点是如何做到数据一致性的呢?zk采用的是最终一致性策略,通过ZAB协议实现,下面介绍ZAB协议

  • ZAB(原子广播协议)

    ZAB是zk特有的一致性协议,并非分布式通用的一致性协议,其基于Paxos演变而来;leader会为每个follower分配一个FIFO的队列,当leader接收到写请求时,会为写入节点分配Zxid,同时将其放入队列;follower按序从队列中取出对应信息向自身的磁盘写日志成功后向leader回一个ack;当leader收到ack的个数大于集群一半时即认为消息确认成功,执行commit操作;并向各follower发起将数据写到内存的操作,至此写入操作完成;

    文字描述太难懂了,于是昨晚画了一个图来展示zk集群内的数据同步过程,如下:

总结:ZAB协议队列和广播以及两阶段提交来实现数据同步。通过队列的FIFO特性以及两阶段提交保证了数据同步的原子性;

通过广播给各个follower集群并且不要求每个follower都同步成功(过半)保证了集群间数据同步的高效性;

leader维护的队列也为最终一致性的策略提供了保证,leader会将所有的写请求都放入队列,follower按顺序消费最终必然会与leader保持数据一致

集群是如何选主的

当leader挂了后,集群中任意节点发现后都会进行选主投票,只要有一个节点触发投票那么集群中每个节点都会被动参与投票,因为集群各节点是互相连通的;zk集群第一次启动谁的ID大谁就是leader,后续集群出了问题重启的话,则谁的数据完整(Zxid大)谁是leader,如果保留的数据一样大则再比较节点自身的myId;

补充

Zxid指的是当前节点的事物id,数值越大表示该节点的数据同步情况越完整;myid指的是在创建zk集群的时候,我们给它配置的值

zk系列一:zookeeper基础介绍的更多相关文章

  1. 【Zookeeper系列】Zookeeper简单介绍(转)

    原文链接:https://www.cnblogs.com/sunddenly/p/4033574.html 一.分布式协调技术 在给大家介绍ZooKeeper之前先来给大家介绍一种技术——分布式协调技 ...

  2. 大数据系列文章-Hadoop基础介绍(一)

    Hadoop项目背景简介 2003-2004年,Google公开了部分GFS个Mapreduce思想的细节,以此为基础Doug Cutting等人用了2年的业余时间,实现了DFS和Mapreduce机 ...

  3. Git系列教程二 基础介绍

    一.存储方式 如果让我们设计一个版本控制系统,最简单的方式就是每做一次更改就生成一个新的文件. 这样的方式太占用空间,所以传统的版本控制系统都是保存一个文件的某个版本的全部内容以及其他版本相对于这个版 ...

  4. zk系列-zookeeper的使用

    zk支持java/c访问,java常用的有apache-zkclient.社区版的i0tec-zkclient.github.adyliu,apache-zkclient是zk自身提供的接口,i0te ...

  5. Hadoop系列-zookeeper基础

    目前是刚刚初学完zookeeper,这篇文章主要是简单的对一些基本的概念进行梳理强化. zookeeper基础概念的理解 有时候计算机领域很多名词都是从一长串英文提取首字母缩写而来,但很不幸zooke ...

  6. Zookeeper系列一:Zookeeper基础命令操作

    有些事不是努力就可以改变的,五十块的人民币设计的再好看,也没有一百块的招人喜欢. 前言 由于公司年底要更换办公地点,所以最近投了一下简历,发现面试官现在很喜欢问dubbo.zookeeper和高并发等 ...

  7. 【01】emmet系列之基础介绍

    [01]emmet系列之基础介绍 [02]emmet系列之HTML语法 [03]emmet系列之CSS语法 [04]emmet系列之编辑器 [05]emmet系列之各种缩写 相关网址 官网:http: ...

  8. 【Hadoop离线基础总结】zookeeper的介绍以及集群环境搭建、网络编程和RPC的简单了解

    ZooKeeper的介绍以及集群环境搭建.网络编程和RPC的简单了解 ZooKeeper介绍 概述 ZooKeeper是一个分布式协调服务的开源框架,主要用来解决分布式集群中应用系统的一致性问题.例如 ...

  9. 死磕 java同步系列之zookeeper分布式锁

    问题 (1)zookeeper如何实现分布式锁? (2)zookeeper分布式锁有哪些优点? (3)zookeeper分布式锁有哪些缺点? 简介 zooKeeper是一个分布式的,开放源码的分布式应 ...

随机推荐

  1. 座位安排(欧拉回路,高斯消元,bitset)

    题面 由于旋转大师 F r e n c h \rm French French 的离去, A r e x t r e \rm Arextre Arextre 光荣地承担了给全班换座位的重任. 由于这是 ...

  2. ZJU-199001 第三周练习 2 数字特征值 位运算算法

    题目 对数字求特征值是常用的编码算法,奇偶特征是一种简单的特征值. 对于一个整数, 从个位开始对每一位数字编号, 个位是 \(1\) 号, 十位是 \(2\) 号, 以此类推. 这个整数在第位上的数字 ...

  3. Mysql之基础知识笔记

    Mysql数据库基础知识个人笔记 连接本地数据库: mysql -h localhost -u root -p 回车输入数据库密码 数据库的基础操作: 查看当前所有的数据库:show database ...

  4. KingbaseES不同字符类型比较转换规则

    Postgresql 常用的字符数据类型的有char.varchar和text,其中 char 固定长度类型, varchar 和 text 是可变长度类型.这三种类型在进行比较时,会进行隐含的类型转 ...

  5. git revert总结

    git revert git revert 是一种创建一次新的commit 来回退某次或某几次commit的一种方式 命令 // 创建一个新的commit,这个commit会删除(下面)commit- ...

  6. Windows优先使用IPv4

    当前主流的Windows系统(从Windows 7之后)都会同时使用ipv6和ipv4,并且优先使用ipv6.当你ping另一个服务器的时候就能看到,优先使用的是ipv6进行通信.由于能够在DNS中解 ...

  7. IEEE浮点数向偶数舍

    CSAPP ​ 向偶数舍入初看上去好像是个相当随意的目标--有什么理由偏向取偶数呢?为什么不始终把位于两个可表示的值中间的值都向上舍入呢?使用这种方法的一个问题就是很容易假想到这样的情景:这种方法舍入 ...

  8. 【ProxySQL】ProxySQL Cluster的搭建

    文章转载自:https://blog.51cto.com/l0vesql/2104643 背景 早期的ProxySQL若需要做高可用,需要搭建两个实例,进行冗余.但两个ProxySQL实例之间的数据并 ...

  9. 安装skywalking(测试使用)

    官方下载地址:https://skywalking.apache.org/downloads/ 需要: JDK8到JDK12已测试,其他版本未测试. # 在线安装jdk8 rpm -ivh https ...

  10. Elastic:为Elasticsearch启动https访问