Kafka系列之-Kafka Protocol实例分析
本文基于A Guide To The Kafka Protocol文档,以及Spark Streaming中实现的org.apache.spark.streaming.kafka.KafkaCluster
类。整理出Kafka中有关
- Metadata API
- Produce API
- Fetch API
- Offset API(Aka ListOffset)
- Offset Commit/Fetch API
- Group Membership API
- Administrative API
零、准备工作
需要运行以下部分的示例代码时,需要提前建好需要的topic
,写入一些message
,再用consumer
消费一下。
1、新建topic
[hadoop@kafka001 kafka]$ bin/kafka-topics.sh --zookeeper kafka001:2181 --create --topic kafka_protocol_test --replication-factor 3 --partitions 4
Created topic "kafka_protocol_test".
[hadoop@kafka001 kafka]$ bin/kafka-topics.sh --zookeeper kafka001:2181 --describe --topic kafka_protocol_test
Topic:kafka_protocol_test PartitionCount:4 ReplicationFactor:3 Configs:
Topic: kafka_protocol_test Partition: 0 Leader: 1 Replicas: 1,2,3 Isr: 1,2,3
Topic: kafka_protocol_test Partition: 1 Leader: 2 Replicas: 2,3,4 Isr: 2,3,4
Topic: kafka_protocol_test Partition: 2 Leader: 3 Replicas: 3,4,1 Isr: 3,4,1
Topic: kafka_protocol_test Partition: 3 Leader: 4 Replicas: 4,1,2 Isr: 4,1,2
2、produce message
使用Kafka系列之-自定义Producer中提到的KafkaProducerTool往指定kafka_protocol_test中发送消息,
public class ProducerTest2 {
public static void main(String[] args) throws InterruptedException {
KafkaProducerTool kafkaProducerTool = new KafkaProducerToolImpl("D:\\Files\\test\\kafkaconfig.properties");
int i = 1;
while(true) {
kafkaProducerTool.publishMessage("message" + (i++));
}
}
}
运行一段时间后停止写入。运行一个console-consumer
从kafka_protocol_test
消费message
。
3、consume message
运行一个console-consumer
从kafka_protocol_test
消费。注意观察该topic
每个partition
中的messages
数。
[hadoop@kafka001 kafka]$ bin/kafka-console-consumer.sh --zookeeper kafka001:2181 --topic kafka_protocol_test --from-beginning
一、Metadata API
这个API是通过向Kafka集群发送一个TopicMetadaaRequest
请求,得到MetadataResponse
响应后从MetadataResponse
中解析出Metadata相关信息。
TopicMetadataRequest
的结构和示例如下
case class TopicMetadataRequest(val versionId: Short,
val correlationId: Int,
val clientId: String,
val topics: Seq[String])
TopicMetadataRequest(TopicMetadataRequest.CurrentVersion, 0, config.clientId, topics)
得到的MetadataResponse
包含的信息如下,可以从PartitionMetadata
中获取到Partition
相关信息,从TopicMetadata
中获取到Topic
相关信息,Broker
中记录了Broker
的ip
和端口号等。
MetadataResponse => [Broker][TopicMetadata]
Broker => NodeId Host Port (any number of brokers may be returned)
NodeId => int32
Host => string
Port => int32
TopicMetadata => TopicErrorCode TopicName [PartitionMetadata]
TopicErrorCode => int16
PartitionMetadata => PartitionErrorCode PartitionId Leader Replicas Isr
PartitionErrorCode => int16
PartitionId => int32
Leader => int32
Replicas => [int32]
Isr => [int32]
1、所包含的信息
可以查询指定Topic是否存在,
指定topic有多少个partition,
每个partition当前哪个broker处于leader状态,
每个broker的host和port是什么
如果设置了auto.create.topics.enable
参数,遇到不存在的topic
时,就会按默认replication
和partition
新建该不存在的topic
。
2、示例
生成一个TopicMetadataRequest
对象
// 封装一个TopicMetadataRequest类型的请求对象
val req = TopicMetadataRequest(TopicMetadataRequest.CurrentVersion, 0, config.clientId, topics)
// 发送该请求
val resp: TopicMetadataResponse = consumer.send(req)
// 其中consumer对象是SimpleConsumer类型的
new SimpleConsumer(host, port, config.socketTimeoutMs,
config.socketReceiveBufferBytes, config.clientId)
(1)查询topic是否存在
由于在TopicMetadataRequest
中可以发送一组Seq[String]
类型的topics
,所以获取到的TopicMetadataResponse.topicsMetadata
是Set[TopicMetadata]
类型的。
对每个TopicMetadata
对象,如果其errorCode
不为ErrorMapping.NoError
即表示该Topic
不正常。
topicMetadatas.foreach { topic =>
if (topic.errorCode == ErrorMapping.NoError)
println(s"topic: ${topic.topic}存在")
else
println(s"topic: ${topic.topic}不存在")
}
(2)获取Topic的Partition个数
首先将所有TopicMetadata
中正常的Topic
过滤出来,然后遍历每一个TopicMetadata
对象,获取其partitionsMetadata
信息,其长度即Partition
的个数
val existsTopicMetadatas = topicMetadatas.filter(tm => tm.errorCode == ErrorMapping.NoError)
existsTopicMetadatas.foreach { topic =>
val numPartitions = topic.partitionsMetadata.length
println(s"topic: ${topic.topic} 有${numPartitions}个partition")
}
(3)获取Partition具体情况
以下代码可以获取到Topic
的每个Partition
中的Leader Partition
以及replication
节点的信息。
existsTopicMetadatas.foreach { topic =>
println(s"topic:${topic.topic}的Partition信息:")
topic.partitionsMetadata.foreach { pm =>
val leaderPartition = pm.leader
println(s"\tpartition: ${pm.partitionId}")
println(s"\tleader节点:$leaderPartition")
val replicas = pm.replicas
println(s"\treplicas节点:$replicas")
}
}
3、运行结果
传入上面新建的kafka_protocol_test
以及一个不存在的topic kafka_protocol_test1
,以上代码的运行结果如下:
=============Topic相关信息===========
topic: kafka_protocol_test存在
topic: kafka_protocol_test1不存在
topic: kafka_protocol_test 有4个partition
=============Partition相关信息===========
topic:kafka_protocol_test的Partition信息:
partition: 0
leader节点:Some(id:1,host:kafka001,port:9092)
replicas节点:Vector(id:1,host:kafka001,port:9092, id:2,host:kafka002,port:9092, id:3,host:kafka003,port:9092)
partition: 1
leader节点:Some(id:2,host:kafka002,port:9092)
replicas节点:Vector(id:2,host:kafka002,port:9092, id:3,host:kafka003,port:9092, id:4,host:kafka004,port:9092)
partition: 2
leader节点:Some(id:3,host:kafka003,port:9092)
replicas节点:Vector(id:3,host:kafka003,port:9092, id:4,host:kafka004,port:9092, id:1,host:kafka001,port:9092)
partition: 3
leader节点:Some(id:4,host:kafka004,port:9092)
replicas节点:Vector(id:4,host:kafka004,port:9092, id:1,host:kafka001,port:9092, id:2,host:kafka002,port:9092)
二、Produce API
三、Fetch API
四、Offset API(Aka ListOffset)
这个API通过向Kafka集群发送一个OffsetRequest
对象,从返回的OffsetResponse
对象中获取Offset
相关信息。
OffsetRequest
对象描述如下
OffsetRequest => ReplicaId [TopicName [Partition Time MaxNumberOfOffsets]]
ReplicaId => int32
TopicName => string
Partition => int32
Time => int64
MaxNumberOfOffsets => int32
上面Time
的作用是,获取特定时间(单位为ms)之前的所有messages
。如果设置为-1
则获取最新的offset
,即下一条messages
的offset
位置;如果设置为-2
则获取第一条message
的offset
位置,即当前partition
中的offset
起始位置。
OffsetResponse
对象描述如下
OffsetResponse => [TopicName [PartitionOffsets]]
PartitionOffsets => Partition ErrorCode [Offset]
Partition => int32
ErrorCode => int16
Offset => int64
1、所包含的信息
通过该API可以获取指定topic-partition
集合的合法offset
的范围,需要直接连接到Partition
的Leader
节点。
2、示例
获取指定topic
下所有partition
的offset
范围
封装一个getLeaderOffsets
方法,在此方法的基础上分别封装一个getEarliestLeaderOffsets
方法用于获取最小offset
,getLatestLeaderOffsets
用于获取最大offset
。
分别传入的关键参数是前面提到的Time
,
def getLatestLeaderOffsets(
topicAndPartitions: Set[TopicAndPartition]
): Either[Err, Map[TopicAndPartition, LeaderOffset]] =
getLeaderOffsets(topicAndPartitions, OffsetRequest.LatestTime) // -1L
def getEarliestLeaderOffsets(
topicAndPartitions: Set[TopicAndPartition]
): Either[Err, Map[TopicAndPartition, LeaderOffset]] =
getLeaderOffsets(topicAndPartitions, OffsetRequest.EarliestTime) // -2L
在getLeaderOffsets中,查询到当前partition的leader节点,
def findLeaders(topicAndPartitions: Set[TopicAndPartition]): Either[Err, Map[TopicAndPartition, (String, Int)]] = {
// 获取当前topicAndPartitions中的所有topic
val topics = topicAndPartitions.map(_.topic)
// 获取topic对应的MetadataResp对象,之前已过滤不存在的topic,所以这里无需进一步过滤
val topicMetadatas = getMetadataResp(topics.toSeq).left.get
val leaderMap = topicMetadatas.flatMap { topic =>
topic.partitionsMetadata.flatMap { pm =>
val tp = TopicAndPartition(topic.topic, pm.partitionId)
// 获取对应PartitionMedatada的leader节点信息
pm.leader.map { l =>
tp -> (l.host -> l.port)
}
}
}.toMap
Right(leaderMap)
}
然后在这些节点中,封装一个OffsetRequest
对象,向Kafka集群获得OffsetResponse
对象。
val resp = consumer.getOffsetsBefore(req)
val respMap = resp.partitionErrorAndOffsets
最后从OffsetResponse
对象中获取offset
范围,
val resp = getMetadataResp(topics.toSeq)
// 如果获取的resp是left,则处理返回的Set[TopicMetadata]
val topicAndPartitions = processRespInfo(resp) { resp =>
val topicMetadatas = resp.left.get.asInstanceOf[Set[TopicMetadata]]
val existsTopicMetadatas = topicMetadatas.filter(tm => tm.errorCode == ErrorMapping.NoError)
getPartitions(existsTopicMetadatas)
}.asInstanceOf[Set[TopicAndPartition]]
// 获取指定topic-partition最早的offset
val offsetBegin = getEarliestLeaderOffsets(topicAndPartitions).right.get
// 获取指定topic-partition最晚的offset
val offsetEnd = getLatestLeaderOffsets(topicAndPartitions).right.get
print("=============Offset范围信息===========")
topicAndPartitions.foreach { tp =>
println(s"topic: ${tp.topic}, Partition: ${tp.partition} 的Offset范围:")
println(s"\t${offsetBegin(tp).offset} ~ ${offsetEnd(tp).offset}")
}
3、运行结果
连接到kafka_protocol_test
,运行结果如下
topic: kafka_protocol_test, Partition: 0 的Offset范围:
0 ~ 9000
topic: kafka_protocol_test, Partition: 1 的Offset范围:
0 ~ 598134
topic: kafka_protocol_test, Partition: 2 的Offset范围:
0 ~ 0
topic: kafka_protocol_test, Partition: 3 的Offset范围:
0 ~ 91000
和第零节中图片显示结果一致。
五、Offset Commit/Fetch API
首先参考Offset Management文档中的描述,分析一下Kafka中有关Offset管理的文档。
在这篇文档中主要提供了OffsetFetch
和OffsetCommit
两个API,其中
1、OffsetFetch API
这个API可以获取一个Consumer
读取message
的offset
信息。发送的请求是OffsetFetchRequest
类型的对象,接收到的是OffsetFetchResponse
类型的响应。具体offset
信息可以从OffsetFetchResponse
对象中解析。
发送的Request
请求为,需要指定consumer
所属的group
,以及需要获取offset
的所有TopicAndPartitions
。
val req = OffsetFetchRequest(groupId, topicAndPartitions.toSeq, 0)
或得到的响应为OffsetFetchResponse类型的对象。
val resp = consumer.fetchOffsets(req)
其中consumer对象是SimpleConsumer类型的
new SimpleConsumer(host, port, config.socketTimeoutMs,
config.socketReceiveBufferBytes, config.clientId)
具体获取offset的逻辑如下,
withBrokers(Random.shuffle(config.seedBrokers)) { consumer =>
// 连接consumer,发送该OffsetFetchRequest请求
val resp = consumer.fetchOffsets(req)
val respMap = resp.requestInfo
// 从传入的topicAndPartitions中取出不包含在result中的topicAndPartition
val needed = topicAndPartitions.diff(result.keySet)
// 遍历每一个需要获取offset的topic-partition
needed.foreach { tp: TopicAndPartition =>
respMap.get(tp).foreach { ome: OffsetMetadataAndError =>
// 如果没有错误
if (ome.error == ErrorMapping.NoError) {
result += tp -> ome
} else {
errs.append(ErrorMapping.exceptionFor(ome.error))
}
}
}
if (result.keys.size == topicAndPartitions.size) {
return Right(result)
}
}
2、OffsetCommit API
当最终调用commit()
方法,或者如果启用了autocommit
参数时,这个API可以使consumer
保存其消费的offset
信息。
发送的Request
请求为OffsetCommitRequest
类型。
OffsetCommitRequest
需要传入的参数如下,
val offsetEnd = getLatestLeaderOffsets(topicAndPartitions).right.get
val resetOffsets = offsetsFetch.right.get.map { offsetInfo =>
val plus10Offset = offsetInfo._2.offset + 10
offsetInfo._1 -> OffsetAndMetadata(if (offsetEnd(offsetInfo._1).offset >= plus10Offset) plus10Offset else offsetEnd(offsetInfo._1).offset)
}
// resetOffsets类型为Map[TopicAndPartition, OffsetAndMetadata]
val req = OffsetCommitRequest(groupId, resetOffsets, 0)
// 发送该请求的方式如下
val resp = consumer.commitOffsets(req)
3、GroupCoordinator API
需要注意的是这个API在Kafka-0.9以后的版本中才提供。指定Consumer Group
的offsets
数据保存在某个特定的Broker
中。
向Kafka
集群发送一个GroupCoordinatorRequest
类型的请求参数,该request
对象中只需要指定一个groupId
即可。如下所示,
val req = new GroupCoordinatorRequest(groupId)
val resp = consumer.send(req)
获取到的Response
对象是GroupCoordinatorResponse
类型的,在resp.coordinatorOpt
中返回一个BrokerEndpoint
对象,可以获取该Broker
对应的Id, Ip, Port
等信息。
4、示例
(1) 运行OffsetFetch API
(a) 获取kafka_protocol_test的consumer group消费状态
启动一个console-consumer
从kafka_protocol_test topic
消费messages
。需要指定一个特定的group.id
参数,如下所示,使用默认的consumer.properties
配置文件即可。
bin/kafka-console-consumer.sh --zookeeper kafka001:2181 --topic kafka_protocol_test --from-beginning --consumer.config ./config/consumer.properties
运行后,将其停止,查看当前console-consumer
的消费状态
[hadoop@kafka001 kafka]$ bin/kafka-consumer-offset-checker.sh --zookeeper kafka001:2181 --topic kafka_protocol_test --group test-consumer-group
Group Topic Pid Offset logSize Lag Owner
test-consumer-group kafka_protocol_test 0 9000 9000 0 none
test-consumer-group kafka_protocol_test 1 26886 598134 571248 none
test-consumer-group kafka_protocol_test 2 0 0 0 none
test-consumer-group kafka_protocol_test 3 18296 91000 72704 none
(b) 运行OffsetFetch代码,查看运行结果
运行时仍然传入test-consumer-group
,运行结果如下
Topic: kafka_protocol_test, Partition: 0
Offset: 9000
Topic: kafka_protocol_test, Partition: 1
Offset: 26886
Topic: kafka_protocol_test, Partition: 2
Offset: 0
Topic: kafka_protocol_test, Partition: 3
Offset: 18296
对比后发现,两个offset
信息保持一致。
(2)运行OffsetCommit API
在这里,将OffsetFetch
获取到的每个TopicAndPartition
对应的Offset
加10
,如果加10
后超过其最大Offset
,则取最大Offset
。
在Commit
前后,两次调用OffsetFetch API的代码,前后运行结果如下,
更新前的offset
:
Topic: kafka_protocol_test, Partition: 0
Offset: 9000
Topic: kafka_protocol_test, Partition: 1
Offset: 26886
Topic: kafka_protocol_test, Partition: 2
Offset: 0
Topic: kafka_protocol_test, Partition: 3
Offset: 18296
更新后的offset:(partition 0和partition 2没有变化是由于加10后超过了该partition的offset范围最大值)
Topic: kafka_protocol_test, Partition: 0
Offset: 9000
Topic: kafka_protocol_test, Partition: 1
Offset: 26896
Topic: kafka_protocol_test, Partition: 2
Offset: 0
Topic: kafka_protocol_test, Partition: 3
Offset: 18306
(3)运行Group Coordinator API
传入一个consumer group
后,查看其运行结果
Comsuner Group : test-consumer-group, coordinator broker is:
id: 1, host: kafka001, port: 9092
六、Group Membership API
这个API从Kafka-0.9.0.0版本开始出现。
在0.9以前的client api中,consumer是要依赖Zookeeper的。因为同一个consumer group中的所有consumer需要进行协同,进行下面所讲的rebalance。但是因为zookeeper的“herd”与“split brain”,导致一个group里面,不同的consumer拥有了同一个partition,进而会引起消息的消费错乱。为此,在0.9中,不再用zookeeper,而是Kafka集群本身来进行consumer之间的同步。下面引自kafka设计的原文:
https://cwiki.apache.org/confluence/display/KAFKA/Kafka+0.9+Consumer+Rewrite+Design#Kafka0.9ConsumerRewriteDesign-Failuredetectionprotocol
相关知识点可以参考Kafka源码深度解析-序列7 -Consumer -coordinator协议与heartbeat实现原理。
七、Administrative API
注意,这个API也是从Kafka-0.9之后的client版本中才提供。通过这个API可以对Kafka集群进行一些管理方面的操作,比如获取所有的Consumer Groups
信息。想要获取集群中所有Consumer Groups
信息,需要发送一个ListGroupRequest
请求到所有的Brokers
节点。
还可以通过发送一个DescribeGroupsRequest
类型的请求对象,获取对特定Consumer Group
的描述。
在Kafka-0.9之后的client
中,提供了一个kafka.admin.AdminClient
类,调用createSimplePlaintext
方法,传入一个broker list字val client = AdminClient.createSimplePlaintext(“kafka001:9092,kafka002:9092,kafka003:9092,kafka004:9092”)AdminClient`提供了很多方法,比如
def findCoordinator(groupId: String): Node
def findAllBrokers(): List[Node]
def listAllGroups(): Map[Node, List[GroupOverview]]
def listAllConsumerGroups(): Map[Node, List[GroupOverview]]
等等。
Kafka系列之-Kafka Protocol实例分析的更多相关文章
- Kafka系列之-Kafka监控工具KafkaOffsetMonitor配置及使用
KafkaOffsetMonitor是一个可以用于监控Kafka的Topic及Consumer消费状况的工具,其配置和使用特别的方便.源项目Github地址为:https://github.com/q ...
- Kafka系列之-Kafka入门
接下来的这些博客,主要内容来自<Learning Apache Kafka Second Edition>这本书,书不厚,200多页.接下来摘录出本书中的重要知识点,偶尔参考一些网络资料, ...
- apache kafka系列之性能优化架构分析
apache kafka中国社区QQ群:162272557 Apache kafka性能优化架构分析 应用程序优化:数据压缩 watermark/2/text/aHR0cDovL2Jsb2cuY3Nk ...
- Kafka系列二 kafka相关问题理解
1.kafka是什么 类JMS消息队列,结合JMS中的两种模式,可以有多个消费者主动拉取数据,在JMS中只有点对点模式才有消费者主动拉取数据. kafka是一个生产-消费模型. producer:生产 ...
- Apache Kafka系列(七)Kafka Repartition操作
Kafka提供了重新分区的命令,但是只能增加,不能减少 我的kafka安装在/usr/local/kafka_2.12-1.0.2目录下面, [root@i-zk1 kafka_2.-]# bin/k ...
- Apache Kafka系列(五) Kafka Connect及FileConnector示例
Apache Kafka系列(一) 起步 Apache Kafka系列(二) 命令行工具(CLI) Apache Kafka系列(三) Java API使用 Apache Kafka系列(四) 多线程 ...
- Kafka系列文章
Kafka系列文章 Kafka设计解析(一)- Kafka背景及架构介绍 Kafka设计解析(二)- Kafka High Availability (上) Kafka设计解析(三)- Kafka H ...
- 分布式消息队列kafka系列介绍 — 核心API介绍及实例
原文地址:http://www.inter12.org/archives/834 一 PRODUCER的API 1.Producer的创建,依赖于ProducerConfig public Produ ...
- 分布式系列九: kafka
分布式系列九: kafka概念 官网上的介绍是kafka是apache的一种分布式流处理平台. 最初由Linkedin开发, 使用Scala编写. 具有高性能,高吞吐量的特定. 包含三个关键能力: 发 ...
随机推荐
- uvalive 5834 Genghis Khan The Conqueror
题意: 给出一个图,边是有向的,现在给出一些边的变化的信息(权值大于原本的),问经过这些变换后,MST总权值的期望,假设每次变换的概率是相等的. 思路: 每次变换的概率相等,那么就是求算术平均. 首先 ...
- scrapy分布式的几个重点问题
我们之前的爬虫都是在同一台机器运行的,叫做单机爬虫.scrapy的经典架构图也是描述的单机架构.那么分布式爬虫架构实际上就是:由一台主机维护所有的爬取队列,每台从机的sheduler共享该队列,协同存 ...
- [LeetCode] Single Element in a Sorted Array 有序数组中的单独元素
Given a sorted array consisting of only integers where every element appears twice except for one el ...
- [LeetCode] Map Sum Pairs 映射配对之和
Implement a MapSum class with insert, and sum methods. For the method insert, you'll be given a pair ...
- [LeetCode] Next Greater Element I 下一个较大的元素之一
You are given two arrays (without duplicates) nums1 and nums2 where nums1’s elements are subset of n ...
- 前端小白想要编写可维护的js
我是一名前端小白,之前没写过多少代码,心里没有代码质量这个概念,人人都说代码是团队的产物,应该将代码写规范,但是我对具体什么样的代码是可维护的是茫然的. 我没写过多少代码,本来好多东西就不咋会,每次给 ...
- [HAOI 2016]食物链
Description 如图所示为某生态系统的食物网示意图,据图回答第1小题. 1.数一数,在这个食物网中有几条食物链( ) 现在给你n个物种和m条能量流动关系,求其中的食物链条数. 物种的名称为从1 ...
- codeforces 651C Watchmen
Watchmen are in a danger and Doctor Manhattan together with his friend Daniel Dreiberg should warn t ...
- 【BZOJ1016】【JSOI2008】最小生成树计数
Description 现在给出了一个简单无向加权图.你不满足于求出这个图的最小生成树,而希望知道这个图中有多少个不同的最小生成树.(如果两颗最小生成树中至少有一条边不同,则这两个最小生成树就是不同的 ...
- FZU 2158
在密室逃脱游戏中,大家被困在一个密室中,为了逃出密室,需要找到正确的数字密码,于是大家分头行动,分别找到了密码的子序列,而后大家将得到的线索集中整理分析,大家想知道密码最少是多少位. Input 第 ...