1.卡夫卡话题

在这篇Kafka文章中,我们将学习Kafka主题与Kafka Architecture的整体概念。Kafka中的体系结构包括复制,故障转移以及并行处理。此外,我们还将看到创建Kafka主题的方法以及Apache Kafka主题的示例,以便更好地理解Kafka。此外,我们将看到Kafka分区和Kafka日志分区。
那么,让我们从Kafka主题开始吧。

Apache Kafka主题 - 架构和分区

2.什么是卡夫卡主题?

简而言之,命名的记录流就是我们所说的Kafka Topic。基本上,在日志中Kafka存储主题。但是,Apache Kafka中的主题日志分为几个分区。此外,Kafka将这些日志的分区分布在多个服务器或磁盘上。换句话说,我们可以说Kafka中的主题是类别,流名称或提要。

卡夫卡的主题是什么?

此外,我们可以说Apache Kafka中的主题本身就是发布的以及订阅样式消息传递。此外,在Kafka主题中可以有零个或多个称为Kafka Consumer Groups的订户。基本上,Kafka中的这些主题分为速度,可伸缩性和大小的分区。
了解有关Kafka Pub-Sub Messaging System的更多信息

3.如何创建Kafka主题

首先,运行kafka-topics.sh并指定主题名称,复制因子和其他属性,以在Kafka中创建主题:

/bin/kafka-topics.sh --create \
--zookeeper <hostname>:<port> \
--topic <topic-name> \
--partitions <number-of-partitions> \
--replication-factor <number-of-replicating-servers>

现在,通过一个分区和一个副本,下面的示例创建一个名为“test1”的主题:
读取Kafka Monitoring

bin/kafka-topics.sh --create \
--zookeeper localhost: \
--replication-factor \
--partitions \
--topic text

此外,运行list topic命令以查看主题:

> bin/kafka-topics.sh --list --zookeeper localhost:
test1

确保当应用程序尝试生成,使用或获取不存在的主题的元数据时,auto.create.topics.enable属性设置为true时会自动创建主题。

4.卡夫卡主题分区

此外,Kafka将主题日志分成几个分区。因此,通常通过记录键,如果密钥存在并且循环,则在密钥丢失时将记录存储在分区上(默认行为)。默认情况下,有助于确定Kafka Producer发送记录的分区的键是Record Key。
基本上,为了在生产者写入的许多服务器上扩展主题,Kafka使用分区。此外,为了促进并行消费者,Kafka使用分区。此外,在故障转移方面,Kafka可以将分区复制到多个Kafka Brokers

5. Kafka主题日志分区的订购和基数

好吧,我们可以说,只有在一个分区中,Kafka确实保持了记录顺序。由于分区也是有序的,不可变的记录序列。并且,通过将分区用作结构化提交日志,Kafka会不断附加到分区。在分区中,所有记录都分配了一个顺序ID号,我们进一步称之为偏移量。该偏移量进一步标识分区内的每个记录位置。
看看Kafka vs RabbitMQ
此外,为了扩展到适合单个服务器的大小,Topic分区允许Kafka日志。主题可以跨越许多服务器上托管的许多分区,但主题分区必须适合托管它的服务器。此外,Apache Kafka中的主题分区是并行的一个单元。也就是说,一次只能由一个分区处理分区消费者群体中的卡夫卡消费者。基本上,Kafka中的Consumer只能在自己的进程或自己的线程中运行。尽管如此,如果消费者停止,Kafka会在同一个消费者群体中的剩余消费者之间传播分区。

6. Kafka主题分区复制

出于容错的目的,Kafka可以跨可配置数量的Kafka服务器执行分区复制。基本上,每个分区中都有一个领导服务器和零个或多个跟随服务器。此外,对于分区,领导者是处理所有读写请求的人。
但是,如果领导者去世,追随者会复制领导者并接管。此外,对于组内的并行消费者处理,Kafka还使用分区。
我们来讨论Kafka Schema

7.复制:Kafka分区领导者,追随者和ISR。

但是,通过使用ZooKeeper,Kafka选择一个代理的分区副本作为领导者。此外,我们可以说,对于分区,具有分区领导者的代理处理所有记录的读写。此外,对于追随者(节点/分区对)的领导者分区,Kafka复制了写入。在定义术语ISR时,同步的跟随者就是我们所说的ISR(同步副本)。尽管如此,如果分区领导失败,Kafka会选择新的ISR作为新的领导者。

8. Kafka架构:Kafka复制 - 复制到分区0

Kafka架构:Kafka复制 - 复制到分区0

让我们讨论一下ZooKeeper在Kafka中的作用
虽然当分区的所有ISR写入其日志时,该记录被认为是“已提交”。但是,我们只能从消费者那里读取提交的记录。

Kafka主题 - 复制到分区1

所以,这完全是关于卡夫卡主题。希望你喜欢我们的解释。
了解有关Kafka Tool的更多信息

9.结论

因此,我们已经详细了解了卡夫卡主题的整个概念。此外,我们讨论了Kafka主题分区,Kafka主题中的日志分区和Kafka复制因子。此外,我们看到了Kafka Architecture并在Kafka创建了一个主题。

Apache Kafka主题 - 架构和分区的更多相关文章

  1. Apache kafka 工作原理介绍

    消息队列 消息队列技术是分布式应用间交换信息的一种技术.消息队列可驻留在内存或磁盘上, 队列存储消息直到它们被应用程序读走.通过消息队列,应用程序可独立地执行--它们不需要知道彼此的位置.或在继续执行 ...

  2. Apache Kafka是数据库吗?

    最近思路有些枯竭,找些务虚的话题来凑.本文内容完全来自于Martin Kelppmann在2019年Kafka伦敦峰会上的演讲.顺便提一句,Kelppmann是<Designing Data-I ...

  3. Apache Kafka:下一代分布式消息系统

    [http://www.infoq.com/cn/articles/apache-kafka/]分布式发布-订阅消息系统. Kafka是一种快速.可扩展的.设计内在就是分布式的,分区的和可复制的提交日 ...

  4. Apache Kafka: 优化部署的10个最佳实践

    原文作者:Ben Bromhead      译者:江玮 原文地址:https://www.infoq.com/articles/apache-kafka-best-practices-to-opti ...

  5. 转 Apache Kafka:下一代分布式消息系统

    简介 Apache Kafka是分布式发布-订阅消息系统.它最初由LinkedIn公司开发,之后成为Apache项目的一部分.Kafka是一种快速.可扩展的.设计内在就是分布式的,分区的和可复制的提交 ...

  6. [kfaka] Apache Kafka:下一代分布式消息系统

    简介 Apache Kafka是分布式发布-订阅消息系统.它最初由LinkedIn公司开发,之后成为Apache项目的一部分.Kafka是一种快速.可扩展的.设计内在就是分布式的,分区的和可复制的提交 ...

  7. Apache Kafka:下一代分布式消息系统【转载】

    简介 Apache Kafka是分布式发布-订阅消息系统.它最初由LinkedIn公司开发,之后成为Apache项目的一部分.Kafka是一种快速.可扩展的.设计内在就是分布式的,分区的和可复制的提交 ...

  8. Apache Kafka Producer For Beginners

    在我们上一篇Kafka教程中,我们讨论了Kafka Cluster.今天,我们将通过示例讨论Kafka Producer.此外,我们将看到KafkaProducer API和Producer API. ...

  9. Apache Kafka 学习笔记

    1. 介绍Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写.Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据. 这种动 ...

随机推荐

  1. 使用GCOV进行代码覆盖率统计

    GCOV是随GCC一起发布的用于代码覆盖率统计的工具,一般配合其图形化工具LCOV一起使用. 一.安装 GCOV不需要单独安装,LCOV下载后执行sudo make install即可完成安装. 二. ...

  2. Codeforces Round #605 (Div. 3) E. Nearest Opposite Parity(最短路)

    链接: https://codeforces.com/contest/1272/problem/E 题意: You are given an array a consisting of n integ ...

  3. oracle 按每天,每周,每月,每季度,每年查询统计数据

    oracle 按每天,每周,每月,每季度,每年查询统计数据 //按天统计 select count(dataid) as 每天操作数量, sum() from tablename group by t ...

  4. win7虚拟机安装

    https://blog.csdn.net/qq_16503045/article/details/81904986 iso下载地址 https://msdn.itellyou.cn/

  5. 微信小程序地图组件

    index.wxml <map id="map" markers="{{markers}}" longitude="{{longitude}}& ...

  6. [HAOI 2018]染色

    传送门 Description 一个长度为\(N\)的序列, 每个位置都可以被染成 \(M\)种颜色中的某一种. 出现次数恰好为 \(S\)的颜色种数有\(i\)种, 会产生\(w_i\)的愉悦度. ...

  7. severless扫盲

    最近老是遇到这个话题,抽一点时间系统的学习下,severless是属于云计算部分,但是和前端息息相关(大家都这么说)- serverless是什么? 字面意思是无服务器,亦或是少服务器的.让用户无需关 ...

  8. 【CSP模拟赛】starway(玄学建边 最小生成树)

    问題描述 小w伤心的走上了 Star way to heaven.   到天堂的道路是一个笛卡尔坐标系上一个n×m的长方形通道(顶点在(0,0))和(n,m)),小w从最左边任意一点进入,从右边任意一 ...

  9. Redis采坑(一)——数据无法插入,内存溢出

    一.采坑背景 在最大数据分析的过程中,redis是被当做热数据的缓存库使用的,在某一天中,redis数据库热数据无法插入,此时数据量大概在100万左右,很是纠结,为什么不能插入?程序的错误,不可能,没 ...

  10. 前端js 爬取 获取网页

    1.存在问题 same origin policy(同源策略) 页面中的Javascript只能读取,访问同域的网页.这里需要注意的是,Javascript自身的域定义和它所在的网站没有任何关系,只和 ...