kafka的HA机制

1、kafka的HA机制：副本机制+消息同步+leader选举。

　　每个topic有多个partition，每个partition又有多个副本，这些副本当中也存在不同的角色，leader、follower。producer和consumer都只跟leader进行交互，leader进行读写操作。leader负责将消息写进本地log当中，follower去leader上pull拉取数据，将数据同步到本地log当中。当leader挂了的时候，就利用zookeeper重新选出一个leader即可。

　　其中，kafka将所有的partition均匀分布在集群中的broker上，所有的Replica副本也均匀分布在集群中的broker上，这样做主要是保证负载均衡和容错能力。因为所有的分区和副本都在一个broker上，那样这个broker挂了，数据也就都丢失了。实现这个均匀分布，使用的是一种算法。主要就是用求余数的运算。

　　Kafka分配Replica的算法如下：

　　1.将所有Broker（假设共n个Broker）和待分配的Partition排序

　　2.将第i个Partition分配到第（i mod n）个Broker上

　　3.将第i个Partition的第j个Replica分配到第（(i + j) mode n）个Broker上

总之，kafka的健壮性主要来源其强大的副本策略。

2、消息同步策略：producer发送消息到某个partition时，首先通过zookeeper获取这个partition的leader， producer只将消息发送给leader ，leader将该消息写入其本地log中，follower从leader上pull数据。为了提高性能，follower收到消息之后直接向leader返回Ack，follower将消息写进本地log中。一旦leader收到了ISR列表中的所有Replica的ack，该消息就被认为已经commit了，leader向producer发送ACK。

consumer读消息也只从leader读取，只有commit的消息才会暴露给consumer。

3、leader选举：所有的follower都在zookeeper上注册watch监听，一旦leader宕机，其对应的ephemeral znode临时节点会被删除，此时所有的follower都去尝试创建该节点，创建成功者，成为新的leader，其他的Replica就是follower。

leader选举本质上是分布式锁，有两种方式实现基于zookeeper的分布式锁。

节点名称唯一性：多个客户端创建一个节点，只有创建成功的才会获得锁。

临时顺序节点：所有的客户端在某个目录下创建自己的临时顺序节点，只有序号最小的才会获得锁。

参考博客：https://www.cnblogs.com/frankdeng/p/9310704.html

kafka的HA机制的更多相关文章

Hadoop_HDFS架构和HA机制
Hadoop学习笔记总结 01.HDFS架构 1. NameNode和ResourceManager NameNode负责HDFS,从节点是DataNode:ResourceManager负责MapR ...
kafka知识体系-kafka设计和原理分析-kafka文件存储机制
kafka文件存储机制 topic中partition存储分布假设实验环境中Kafka集群只有一个broker,xxx/message-folder为数据文件存储根目录,在Kafka broker中 ...
HA机制下的Hadoop配置
[版权申明:本文系作者原创,转载请注明出处] 文章出处:http://www.cnblogs.com/sdksdk0/p/5585355.html 作者: 朱培 ID:sdksdk0 ----- ...
Kafka文件存储机制及partition和offset
转载自: https://yq.aliyun.com/ziliao/65771 参考: Kafka集群partition replication默认自动分配分析如何为kafka选择合适的p ...
一脸懵逼学习Hadoop-HA机制（以及HA机制的配置文件，测试）
1:能否让两个NameNode都正常影响客户端请求? 应该让两个NameNode节点在某个时间只能有一个节点正常影响客户端请求,相应请求的必须为Active状态的那一台. 2:standBy状态的节点 ...
Kafka文件存储机制及offset存取
Kafka是什么 Kafka是最初由Linkedin公司开发,是一个分布式.分区的.多副本的.多订阅者,基于zookeeper协调的分布式日志系统(也可以当做MQ系统),常见可以用于web/nginx ...
Kafka文件存储机制那些事
Kafka是什么 Kafka是最初由Linkedin公司开发,是一个分布式.分区的.多副本的.多订阅者,基于zookeeper协调的分布式日志系统(也可以当做MQ系统),常见可以用于web/nginx ...
Kafka 文件存储机制那些事 - 美团技术团队
出处:https://tech.meituan.com/2015/01/13/kafka-fs-design-theory.html 自己总结: Kafka 文件存储机制_结构图:https://ww ...
HDFS的HA机制
传统的HDFS机制如下图所示: 也就是存在一个NameNode,一个SecondaryNameNode,然后若干个DataNode.这样的机制虽然元数据的可靠性得到了保证(靠edits,fsimage ...

随机推荐

Kafka工具教程 - Apache Kafka中的2个重要工具
1.目标 - 卡夫卡工具在我们上一期的Kafka教程中,我们讨论了Kafka Workflow.今天,我们将讨论Kafka Tool.首先,我们将看到卡夫卡的意义.此外,我们将了解两个Kafka工具 ...
【C++札记】类的继承
继承面向对象的设计思想,类对数据做了封装,并可以加入访问权限,类的继承是面向对象思想的精髓.类的继承可以让新类从以有的类中获得已有的特征.原有类称为基类或父类,新类称为派生类或子类. 语法: cla ...
c++基础（七）——面向对象程序设计
面向对象程序设计(Object-oriented programming)的核心思想是数据抽象,继承,和动态绑定. 1. 继承在C++语言中,基类将类型相关的函数与派生类不做改变直接继承的函数区分对 ...
git简单介绍
一种常见的版本控制工具获取克隆仓库 git支持以ssh或者http的方式来标识远程仓库 git clone git@github.com:username/project.git git clon ...
kubernetes 实践三：使用kubeadm安装k8s1.16.0
环境版本说明: 三台vmware虚拟机,系统版本CentOS7.6. Kubernetes 1.16.0,当前最新版. flannel v0.11 docker 18.09 使用kubeadm可以简单 ...
Ubuntu修改文件权限以及更换文件所有者
参数 -R 用来递归实现更改所有子文件和子目录的权限. 1.利用chmod修改权限: 对Document/目录下的所有子文件与子目录执行相同的权限变更: chmod -R 700 文件名 700是变更 ...
Js学习02--变量、关键字、标识符
一.Js变量的定义 1.定义变量的目的在内存中分配一块存储空间给变量,方便以后存储数据. 2.如何定义变量任何变量在使用前都必须定义变量 var 变量名称 eg: var name,age,sex ...
JSVC安装
执行./start-all.sh启动hadoop时报错 Starting datanodes node1: ERROR: Cannot set priority of datanode process ...
[LOJ2002] [SDOI2017] 序列计数
题目链接 LOJ:https://loj.ac/problem/2002 洛谷:https://www.luogu.org/problemnew/show/P3702 Solution 考虑补集转换, ...
SpringBoot +MSSQL
____SpringBoot +MSSQL_______________________________________________________________________________ ...

kafka的HA机制

kafka的HA机制的更多相关文章

随机推荐

热门专题