kafka consumer 分区reblance算法

转载请注明原创地址 http://www.cnblogs.com/dongxiao-yang/p/6238029.html

最近需要详细研究下kafka reblance过程中分区计算的算法细节，网上搜了部分说法，感觉比较晦涩且不太易懂，还是自己抠源码比较简便一点。

kafka reblance计算部分代码如下：

class RangeAssignor() extends PartitionAssignor with Logging {

  def assign(ctx: AssignmentContext) = {

    val valueFactory = (topic: String) => new mutable.HashMap[TopicAndPartition, ConsumerThreadId]

    val partitionAssignment =

      new Pool[String, mutable.Map[TopicAndPartition, ConsumerThreadId]](Some(valueFactory))

    for (topic <- ctx.myTopicThreadIds.keySet) {

      val curConsumers = ctx.consumersForTopic(topic)

      val curPartitions: Seq[Int] = ctx.partitionsForTopic(topic)

      val nPartsPerConsumer = curPartitions.size / curConsumers.size

      val nConsumersWithExtraPart = curPartitions.size % curConsumers.size

      info("Consumer " + ctx.consumerId + " rebalancing the following partitions: " + curPartitions +

        " for topic " + topic + " with consumers: " + curConsumers)

      for (consumerThreadId <- curConsumers) {

        val myConsumerPosition = curConsumers.indexOf(consumerThreadId)

        assert(myConsumerPosition >= 0)

        val startPart = nPartsPerConsumer * myConsumerPosition + myConsumerPosition.min(nConsumersWithExtraPart)

        val nParts = nPartsPerConsumer + (if (myConsumerPosition + 1 > nConsumersWithExtraPart) 0 else 1)

        /**

         *   Range-partition the sorted partitions to consumers for better locality.

         *  The first few consumers pick up an extra partition, if any.

         */

        if (nParts <= 0)

          warn("No broker partitions consumed by consumer thread " + consumerThreadId + " for topic " + topic)

        else {

          for (i <- startPart until startPart + nParts) {

            val partition = curPartitions(i)

            info(consumerThreadId + " attempting to claim partition " + partition)

            // record the partition ownership decision

            val assignmentForConsumer = partitionAssignment.getAndMaybePut(consumerThreadId.consumer)

            assignmentForConsumer += (TopicAndPartition(topic, partition) -> consumerThreadId)

          }

        }

      }

    }

  def getPartitionsForTopics(topics: Seq[String]): mutable.Map[String, Seq[Int]] = {

    getPartitionAssignmentForTopics(topics).map { topicAndPartitionMap =>

      val topic = topicAndPartitionMap._1

      val partitionMap = topicAndPartitionMap._2

      debug("partition assignment of /brokers/topics/%s is %s".format(topic, partitionMap))

      (topic -> partitionMap.keys.toSeq.sortWith((s,t) => s < t))

    }

  }

  def getConsumersPerTopic(group: String, excludeInternalTopics: Boolean) : mutable.Map[String, List[ConsumerThreadId]] = {

    val dirs = new ZKGroupDirs(group)

    val consumers = getChildrenParentMayNotExist(dirs.consumerRegistryDir)

    val consumersPerTopicMap = new mutable.HashMap[String, List[ConsumerThreadId]]

    for (consumer <- consumers) {

      val topicCount = TopicCount.constructTopicCount(group, consumer, this, excludeInternalTopics)

      for ((topic, consumerThreadIdSet) <- topicCount.getConsumerThreadIdsPerTopic) {

        for (consumerThreadId <- consumerThreadIdSet)

          consumersPerTopicMap.get(topic) match {

            case Some(curConsumers) => consumersPerTopicMap.put(topic, consumerThreadId :: curConsumers)

            case _ => consumersPerTopicMap.put(topic, List(consumerThreadId))

          }

      }

    }

    for ( (topic, consumerList) <- consumersPerTopicMap )

      consumersPerTopicMap.put(topic, consumerList.sortWith((s,t) => s < t))

    consumersPerTopicMap

  }

计算过程主要由上述高亮代码部分实现，举例说明，一个拥有十个分区的topic，相同group拥有三个consumerid为aaa,ccc,bbb的消费者

1 由后两段代码可知，获取consumerid列表和partition分区列表都是已经排好序的，所以

curConsumers=(aaa,bbb,ccc)

curPartitions=(0,1,2,3,4,5,6,7,8,9)

nPartsPerConsumer=10/3 =3

nConsumersWithExtraPart=10%3 =1

3 假设当前客户端id为aaa

myConsumerPosition= curConsumers.indexof(aaa) =0

4 计算分区范围

startPart= 3*0+0.min(1) = 0

nParts = 3+(if (0 + 1 > 1) 0 else 1)=3+1=4

所以aaa对应的分区号为[0,4),即0，1，2，3前面四个分区

同理可得bbb对应myConsumerPosition=1，对应分区4，5，6中间三个分区

ccc对应myConsumerPosition=2，对应7，8，9最后三个分区。

kafka consumer 分区reblance算法的更多相关文章

kafka consumer频繁reblance
转载请注明地址http://www.cnblogs.com/dongxiao-yang/p/5417956.html 结论与下文相同,kafka不同topic的consumer如果用的groupid名 ...
Kafka设计解析（四）- Kafka Consumer设计解析
本文转发自Jason’s Blog,原文链接 http://www.jasongj.com/2015/08/09/KafkaColumn4 摘要本文主要介绍了Kafka High Level Con ...
[Big Data - Kafka] Kafka设计解析（四）：Kafka Consumer解析
High Level Consumer 很多时候,客户程序只是希望从Kafka读取数据,不太关心消息offset的处理.同时也希望提供一些语义,例如同一条消息只被某一个Consumer消费(单播)或被 ...
Kafka Consumer API样例
Kafka Consumer API样例 1. 自动确认Offset 说明参照:http://blog.csdn.net/xianzhen376/article/details/51167333 Pr ...
kafka consumer assign 和 subscribe模式差异分析
转载请注明原创地址:http://www.cnblogs.com/dongxiao-yang/p/7200971.html 最近需要研究flink-connector-kafka的消费行为,发现fli ...
Kafka学习笔记之Kafka Consumer设计解析
0x00 摘要本文主要介绍了Kafka High Level Consumer,Consumer Group,Consumer Rebalance,Low Level Consumer实现的语义,以 ...
初始 Kafka Consumer 消费者
温馨提示:整个 Kafka 专栏基于 kafka-2.2.1 版本. 1.KafkaConsumer 概述根据 KafkaConsumer 类上的注释上来看 KafkaConsumer 具有如下特征 ...
【原创】美团二面：聊聊你对 Kafka Consumer 的架构设计
在上一篇中我们详细聊了关于 Kafka Producer 内部的底层原理设计思想和细节, 本篇我们主要来聊聊 Kafka Consumer 即消费者的内部底层原理设计思想. 1.Consumer之总体 ...
kafka consumer代码梳理
kafka consumer是一个单纯的单线程程序,因此相对于producer会更好理解些.阅读consumer代码的关键是理解回调,因为consumer中使用了大量的回调函数.参看kafka中的回调 ...

随机推荐

关于angular 自定义directive
关于angular 自定义directive的小结首先我们创建一个名为"expander"的自定义directive指令: angular.module("myApp& ...
PHP设计模式之工厂/单例/注册者模式
工厂模式简单工厂模式 [静态工厂方法模式](Static Factory Method)是类的创建模式工厂模式的几种形态: 1.简单工厂模式(Simple Factory)又叫做静态工厂方法模式 ...
ECMAScript 5正式发布
这周ECMAScript 5也即众所周知的JavaScript正式发布了(pdf),在给基本库带来更新的同时,还引入了更加严格的运行时模型,来帮助定位并移除通常的代码错误. 而早期对于ECMAScri ...
php提取背景图片
preg_match_all('/background\s*-\s*+image\s*:\s*url\s*$"*([^"]*)"*$/i', $content,$ma ...
Eclipse+Tomcat WEB开发配置
关键字:JDK,WEB,Eclipse,Tomcat OS: Windows 8.1 with update 1.下载安装JDK:http://www.oracle.com/technetwork/j ...
POJ 1035 Spell checker 简单字符串匹配
在输入的单词中删除或替换或插入一个字符,看是否在字典中.直接暴力,172ms.. #include <stdio.h> #include <string.h> ]; ][], ...
ipad ------ 与iPhone的差别
1. 差异 iPhone是手机,iPad.iPad Mini是平板电脑 iPhone和iPad开发的区别屏幕的尺寸 \分辨率 UI元素的排布 \设计键盘 API 屏幕方向的支持 … … 2. iP ...
asp.net mvc4 Controller与Action执行过程的研究（学习笔记）
当IIS收到一个http请求,把请求信息发给对应的HttpModel(实际是实现类UrlRoutingModule),在HttpModel中会注册HttpApplication 类中的PostReso ...
delphi xe5 android 开发数据访问server端(二)
上一篇我们创建了一个拟给手机端访问的webservices服务接下来创建一个返回数据集的过程,用webservices发布,供手机端调用.这里我使用firedac 1.打开上一篇自动创建的WebMo ...
bzoj 3597: [Scoi2014]方伯伯运椰子 0/1分数规划
3597: [Scoi2014]方伯伯运椰子 Time Limit: 30 Sec Memory Limit: 64 MBSubmit: 144 Solved: 78[Submit][Status ...

kafka consumer 分区reblance算法

kafka consumer 分区reblance算法的更多相关文章

随机推荐

热门专题