我的 Kafka 旅程 - broker

【我的 Kafka 旅程 - broker】的更多相关文章

我的 Kafka 旅程 - broker

broker在kafka的服务端运行,一台服务器相当于一个broker:每个broker下可以有多个topic,每个topic可以有多个partition,在producer端可以对消息进行分区,每个partiton可以有多个副本,可以使得数据不丢失. 通常以集群模式,下面来阐述一下broker的几个状况. 分区数据与副本 kafka的partition有一个leader的数据区域,是为了接收producer端发送的数据:也可以通过克隆leader的方式创建副本,leader与副本保持数据同步,…

Flume连接Kafka的broker出错

在启动Flume的时候,出现下面的异常,但是程序照样能运行,Kafka也能够收到数据,只是偶尔会断点. 2016-08-25 15:32:54,561 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - kafka.utils.Logging$class.info(Logging.scala:68)] Fetching metadata from broker id:2,host:10.208.129.5,port:9092 with…

【Kafka】Broker之Server.properties的重要参数说明

名称描述类型默认值有效值区间重要程度 zookeeper.connect zk地址 string 高 advertised.host.name 过时的:只有当advertised.listeners或listeners没有配置的时候才会生效.使用advertised.listeners代替.发布在zk上的hostname,供客户端使用.在IaaS环境下,该值需要与broker绑定的接口不一样.如果该值没有配置,会使用配置的host.name.否则会使用java.net.InetAddr…

我的 Kafka 旅程 - Linux下的安装 & 基础命令

准备工作安装解压缩工具 tar # 检查是否安装了解压缩工具 tar yum list tar # 如未安装 tar yum install tar -y 安装必备的 java # 检查是否安装了 java-openjdk,这里选择 java-1.8.0.openjdk 版 yum list java-1.8.0.openjdk # 如未安装 java-openjdk yum install java-1.8.0.openjdk -y 安装 kafka 官网下载地址:https://kafka…

我的 Kafka 旅程 - 文件存储机制

存储机制 Topic在每个Broker下存储所属的Partition,Partition下由 Index.Log 两类文件组成. 写入 Log 由多个Segment文件组成,每个Segment文件容量最多为1GB,接收到的新消息永远是以追加的方式于Segment中(只追加不修改的方式减少了查询的消耗),每个消息有自增编号. 查询 Index 文件仅记录固定消息量的索引编号范围,Kafka在查询时,先从Index中定位到小范围的索引编号区间,再去Log中在小范围的数据块中查询具体数据,此索引区间的…

我的 Kafka 旅程 - Consumer

kafka采用Consumer消费者Pull主动拉取数据的方式,当Broker无数据时,消费者空转.Kafka并不删除已消费的消息,各自独立的消费者可消费同一个Broker分区数据. 消费流程 1.消费者发起网络消费请求 # 每批次最小抓取设置(推荐1字节) fetch.min.bytes # 每批次最大抓取大小设置(推荐500ms) fetch.max.bytes # 未达到大小的超时设置(推荐50M) fetch.max.wait.ms 2.拉取数据到内存消费队列中 # 单次拉取最大消息条数…