Kafka源码分析

本文主要针对于Kafka的源码进行分析，版本为kafka-0.8.2.1。由于时间有限，可能更新比较慢...

Kafka.scala

// 读取配置文件

val props = Utils.loadProps(args(0))

val serverConfig = new KafkaConfig(props)

KafkaMetricsReporter.startReporters(serverConfig.props)

val kafkaServerStartable = new KafkaServerStartable(serverConfig)

// 注册一个关闭钩子，当JVM关闭时调用KafkaServerStartable.shutdown

Runtime.getRuntime().addShutdownHook(new Thread() {

  override def run() = kafkaServerStartable.shutdown

})  

// 运行并等待结束

kafkaServerStartable.startup

kafkaServerStartable.awaitShutdown

Server

实际调用类为KafkaServer

def startup() {

  kafkaScheduler.startup()

  // 初始化Zookeeper内相关路径

  zkClient = initZk()

  // 日志管理器

  logManager = createLogManager(zkClient, brokerState)

  logManager.startup()

  socketServer = new SocketServer(...)

  socketServer.startup()

  // 启动副本管理器

  replicaManager = new ReplicaManager(config, time, zkClient, kafkaScheduler, logManager, isShuttingDown)

  // 创建偏移量管理器

  offsetManager = createOffsetManager()

  // 实例化调度器

  kafkaController = new KafkaController(config, zkClient, brokerState)

  // 请求处理器

  apis = new KafkaApis(...)

  // 网络请求处理

  requestHandlerPool = new KafkaRequestHandlerPool(config.brokerId, socketServer.requestChannel, apis, config.numIoThreads)

  brokerState.newState(RunningAsBroker)

  Mx4jLoader.maybeLoad()

  replicaManager.startup()

  kafkaController.startup()

  // Topic配置管理器

  topicConfigManager = new TopicConfigManager(zkClient, logManager)

  topicConfigManager.startup()

  // Broker的心跳检查

  kafkaHealthcheck = new KafkaHealthcheck(...)

  kafkaHealthcheck.startup()

  registerStats()

  startupComplete.set(true)

  info("started")

}

在KafkaServer的startup中看到主要进行几个主要服务的初始化和启动。

private def initZk(): ZkClient =

{

  info("Connecting to zookeeper on " + config.zkConnect)

  // Kafka在Zookeeper中的工作根目录

  val chroot = {

    if (config.zkConnect.indexOf("/") > 0)

      config.zkConnect.substring(config.zkConnect.indexOf("/"))

    else

      ""

  }

  // 创建工作根目录

  if (chroot.length > 1) {

    val zkConnForChrootCreation = config.zkConnect.substring(0, config.zkConnect.indexOf("/"))

    val zkClientForChrootCreation = new ZkClient(...)

    ZkUtils.makeSurePersistentPathExists(zkClientForChrootCreation, chroot)

    info("Created zookeeper path " + chroot)

    zkClientForChrootCreation.close()

  }

  // 实例化ZkClient

  val zkClient = new ZkClient(config.zkConnect, config.zkSessionTimeoutMs, config.zkConnectionTimeoutMs, ZKStringSerializer)

  // 在Zookeeper中创建必要持久路径

  ZkUtils.setupCommonPaths(zkClient)

  zkClient

}

KafkaScheduler实际为对线程池ScheduledThreadPoolExecutor的封装，这里不做过多的分析。

KafkaHealthcheck(...)

{

  val brokerIdPath = ZkUtils.BrokerIdsPath + "/" + brokerId

  val sessionExpireListener = new SessionExpireListener

  def startup()

  {

    // 注册一个Zookeeper事件(状态)监听器

    zkClient.subscribeStateChanges(sessionExpireListener)

    // 在Zookeeper的/brokers/ids/id目录创建临时节点并写入节点信息

    register()

  }

}

IZkStateListener 定义了两种事件：一种是连接状态的改变，例如由未连接改变成连接上，连接上改为过期等；

另一种创建一个新的session（连接），通常是由于session失效然后新的session被建立时触发。

class SessionExpireListener() extends IZkStateListener

{

  @throws(classOf[Exception])

  def handleStateChanged(state: KeeperState) {}

  @throws(classOf[Exception])

  def handleNewSession() = register()

}

ReplicaManager

def startup()

{

  scheduler.schedule("isr-expiration", maybeShrinkIsr, period = config.replicaLagTimeMaxMs, unit = TimeUnit.MILLISECONDS)

}

// 定时调用maybeShrinkIsr

private def maybeShrinkIsr(): Unit =

{

  trace("Evaluating ISR list of partitions to see which replicas can be removed from the ISR")

  allPartitions.values.foreach(partition => partition.maybeShrinkIsr(config.replicaLagTimeMaxMs, config.replicaLagMaxMessages))

}

这里调用了cluster.Partition中的maybeShrinkIsr来将卡住的或者低效的副本从ISR中去除并更新HighWatermark。

def maybeShrinkIsr(replicaMaxLagTimeMs: Long,  replicaMaxLagMessages: Long)

{

  inWriteLock(leaderIsrUpdateLock) {

    leaderReplicaIfLocal() match {

      case Some(leaderReplica) =>

      // 找出卡住和低效的Replica并从ISR中去除

        val outOfSyncReplicas = getOutOfSyncReplicas(leaderReplica, replicaMaxLagTimeMs, replicaMaxLagMessages)

        if(outOfSyncReplicas.size > 0) {

          val newInSyncReplicas = inSyncReplicas -- outOfSyncReplicas

          assert(newInSyncReplicas.size > 0)

          // 更新ZK中的ISR

          updateIsr(newInSyncReplicas)

          // 计算HW并更新

          maybeIncrementLeaderHW(leaderReplica)

          replicaManager.isrShrinkRate.mark()

        }

  ...

}

def getOutOfSyncReplicas(leaderReplica: Replica, keepInSyncTimeMs: Long, keepInSyncMessages: Long): Set[Replica] =

{

  // Leader的最后写入偏移量

  val leaderLogEndOffset = leaderReplica.logEndOffset

  // ISR中排除LeaderReplica的其他集合

  val candidateReplicas = inSyncReplicas - leaderReplica

  // 卡住的Replica集合

  val stuckReplicas = candidateReplicas.filter(r => (time.milliseconds - r.logEndOffsetUpdateTimeMs) > keepInSyncTimeMs)

  // 低效的Replica

  // 条件1 Replicas的offset > 0

  // 条件2 Leader的offset - Replicas的offset > 阀值

  val slowReplicas = candidateReplicas.filter(r =>

    r.logEndOffset.messageOffset >= 0 &&

    leaderLogEndOffset.messageOffset - r.logEndOffset.messageOffset > keepInSyncMessages)

  // 返回卡住的和低效的Replicas

  stuckReplicas ++ slowReplicas

}

Cluster

Controller

Kafka源码分析的更多相关文章

Apache Kafka源码分析 – Broker Server
1. Kafka.scala 在Kafka的main入口中startup KafkaServerStartable, 而KafkaServerStartable这是对KafkaServer的封装 1: ...
Kafka源码分析系列-目录(收藏不迷路)
持续更新中,敬请关注! 目录 <Kafka源码分析>系列文章计划按"数据传递"的顺序写作,即:先分析生产者,其次分析Server端的数据处理,然后分析消费者,最后再补充 ...
Kafka源码分析(一) - 概述
系列文章目录 https://zhuanlan.zhihu.com/p/367683572 目录系列文章目录一. 实际问题二. 什么是Kafka, 如何解决这些问题的三. 基本原理 1. 基本 ...
Kafka源码分析(三) - Server端 - 消息存储
系列文章目录 https://zhuanlan.zhihu.com/p/367683572 目录系列文章目录一. 业务模型 1.1 概念梳理 1.2 文件分析 1.2.1 数据目录 1.2.2 . ...
kafka源码分析之一server启动分析
0. 关键概念关键概念 Concepts Function Topic 用于划分Message的逻辑概念,一个Topic可以分布在多个Broker上. Partition 是Kafka中横向扩展和一 ...
apache kafka源码分析-Producer分析---转载
原文地址:http://www.aboutyun.com/thread-9938-1-1.html 问题导读1.Kafka提供了Producer类作为java producer的api,此类有几种发送 ...
Kafka源码分析及图解原理之Producer端
一.前言任何消息队列都是万变不离其宗都是3部分,消息生产者(Producer).消息消费者(Consumer)和服务载体(在Kafka中用Broker指代).那么本篇主要讲解Producer端,会有 ...
Kafka源码分析(二) - 生产者
系列文章目录 https://zhuanlan.zhihu.com/p/367683572 目录系列文章目录一. 使用方式 step 1: 设置必要参数 step 2: 创建KafkaProduc ...
Kafka源码分析－序列2 －Producer
在上一篇,我们从使用方式和策略上,对消息队列做了一个宏观描述.从本篇开始,我们将深入到源码内部,仔细分析Kafka到底是如何实现一个分布式消息队列.我们的分析将从Producer端开始. 从Kafka ...

随机推荐

input type = number 去除上下箭头，禁用滚轮事件（默认的自带滚轮加减数字）
<style type="text/css"> /*盒子大小从边框开始计算*/ html * { box-sizing: border-box; } /*解决模态框抖动 ...
goreman 多进程管理工具
Linux下多进程管理工具对开发和运维都很有用,常见的功能全面的主流工具主要有monit.supervisor.不过开发中使用则推荐轻量级小工具goreman 举个例子:coreos的etcd就是使用 ...
MDK警告 warning: #111-D: statement is unreachable
解析: "statement is unreachable"这句一般是说编译器认为程序执行不到这里. 因为本人运行程序的时候,再向前有一个While(1)循环, 理论上说除非你里面 ...
python一些内建函数(map,zip,filter,reduce,yield等)
python一些内建函数(map,zip,filter,reduce,yield等) map函数 Python实际上提供了一个内置的工具,map函数.这个函数的主要功能是对一个序列对象中的每一个元素应 ...
linux tcpdump命令抓包
tcpdump host 210.27.48.1 and \ (210.27.48.2 or 210.27.48.3 \) 截获主机210.27.48.1 和主机210.27.48.2 或210.27 ...
php-fpm设置与 phpMyadmin超时操作SQL超时
LNMP 一键安装包环境: Phpmyadmin 登录超时 (1440 秒未活动),请重新登录. vim /usr/local/php/etc/php.ini session.gc_maxlife ...
Cmake编译opencv下载不了ffmpeg时的解决办法
databaseDesgin-temple
ylbtech-dbs:ylbtech-storebook- A, 返回顶部 1, 2, B,返回顶部 1, 2, C,返回顶部作者:ylbtech出处:http://storebook.cnblo ...
阿里云专有网络下一键安装RouterOS-ROS系统
1.阿里云环境centos6.9 x64: 内网网卡为eth0 阿里云的linux下硬盘名称为/dev/vda 注意阿里云的安全组建议开放任意协议和端口,任意IP允许访问今天测试阿里云2C4G的死活 ...
文档主题生成模型（LDA）
一．问题描述 1.1文本建模相关统计文本建模的目的其实很简单:就是估算一组参数,这组参数使得整个语料库出现的概率最大.这是很简单的极大似然的思想了,就是认为观测到的样本的概率是最大的.建模的目标也是 ...

Kafka源码分析

Kafka源码分析的更多相关文章

随机推荐

热门专题