[DB] Kafka
介绍
- 一种高吞吐量的分布式发布订阅消息系统
- 消息类型:主体Topic(广播)、队列Queue(一对一)
- 消息系统类型:同步消息系统、异步消息系统
- 常见消息产品:Redis、Kafka、JMS
术语
- Producer:生产者,向 Kafka Broker 上的 Topic 发布消息的应用程序
- Broker:缓存代理服务进程,一个Kafka 集群由多个 Broker 组成,Broker 负责接收和处理客户端发送过来的请求,以及对消息进行持久化
- Message:消息,通信的基本单位,每个 Producer 可以向一个 Topic 发布消息
- Topic:承载消息的逻辑容器,在实际使用中多用来区分具体的业务
- Partition:Topic物理上的分组,一个Topic可以分为多个Partition,每个Partition是一个有序的队列。Partition中的每条消息都会被分配一个有序的id(Offset),一个分区对应一个消费者
- Consumer:消费者,订阅 Topics 并从上面拉取消息的应用程序
- Group:消费组,多个消费者组成一个消费组
- Offset:表示分区中每条消息的位置信息,是一个单调递增且不变的值,消费者在消费的过程中使用 Offset 记录自己消费了多少数据。老版本用zookeeper存储offset,当consumer宕机重启后读取offset,从上次消费截止的地方继续消费。新版本将offset作为普通消息存在kafka中,提交到__consumer_offsets中保存
- Coordinator:协调者,为 Consumer Group 服务,负责为 Group 执行 Rebalance 以及提供位移管理和组成员管理等,所有 Broker 都有各自的 Coordinator 组件
流程
- Producer将消息推送到Broker,Consumer从Broker拉取消息
- 每条消息被顺序写入到Partition中
- 同一Topic的一条消息只能被同一个Consumer Group内的一个Consumer消费,多个Consumer Group可同时消费这一消息
- 将 Consumer 的位移数据作为一 条条普通的 Kafka 消息,提交到位移主题 __consumer_offsets 中
- Kafka 集群中的第一个 Consumer 程序启动时,Kafka 会自动创建位移主题
设计要点
- 内存访问:使用Linux文件系统的cache,高效缓存数据
- 磁盘持久化:不再内存中cache,直接顺序写入磁盘
- zero-copy:减少IO操作
- 消息处理:支持数据批量发送压缩
- 主题分区:Topic 划分为多个 Partition,提高消息处理并行度
- 负载均衡:Producer 根据用户指定算法,将消息发送到指定的 Partition
- 消息拉取:简化kafka设计,Consumer根据消费能力自主控制消息拉取速度,自主选择消费模式
- 可扩展性:需要增加 Broker结点时,新增 Broker向 ZK 注册,Procucer 和 Consumer根据 ZK 上的 Watcher 调整
应用场景
- 消息队列
- 行为跟踪
- 元信息监控
- 日志收集
- 流处理
命令
- Broker配置文件:config/server.properties
- id:0
- 端口:9092
- zookeeper:localhost:2181
- 启动:bin/kafka-server-start.sh config/server.properties &
- 创建主题:bin/kafka-topics.sh --create --zookeeper localhost:2181 -replication-factor 1 --partitions 3 --topic mydemo1
- 列出主题:bin/kafka-topics.sh --zookeeper bigdata111:2181 --list
- 删除主题:bin/kafka-topics.sh --zookeeper bigdata111:2181 --delete --topic mydemo1
- 生产者(发送消息):bin/kafka-console-producer.sh --broker-list localhost:9092 --topic mydemo1
- 消费者(接收消息)
- bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic mydemo1(老版本)
- bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic mydemo1(新版本)
参考
Kafka 教程
https://blog.csdn.net/hmsiwtv/article/details/46960053
https://www.orchome.com/kafka/index
https://www.cnblogs.com/wq3435/p/8001094.html
Kafka 中 bootstrap-server broker-list 和 zookeeper的区别
https://www.cnblogs.com/tonglin0325/p/8810313.html
Kafka offset
https://www.cnblogs.com/wq3435/p/8001094.html
CDH Kafka
https://www.cnblogs.com/yangshibiao/p/10868615.html
SparkStreaming Kafka
https://www.jianshu.com/p/667e0f58b7b9
Exactly Once
https://blog.csdn.net/liangyihuai/article/details/82931140
Resetting first dirty offset of __consumer_offsets
https://www.pianshen.com/article/3368623605/
[DB] Kafka的更多相关文章
- Kafka监控系统Kafka Eagle:支持kerberos认证
在线文档:https://ke.smartloli.org/ 作者博客:https://www.cnblogs.com/smartloli/p/9371904.html 源码地址:https://gi ...
- Kafka监控系统Kafka Eagle剖析
1.概述 最近有同学留言反馈了使用Kafka监控工具Kafka Eagle的一些问题,这里笔者特意整理了这些问题.并且希望通过这篇博客来解答这些同学的在使用Kafka Eagle的时候遇到的一些困惑, ...
- kafka监控kafka-eagle 容器化配置
由于kafka.zk 集群已经部署在k8s中, kafka的服务名 kafka-hs, zk的服务名为:zk-cs ,对kafka进行监控,所以需要把监控部署到k8s中,选择使用kafka-eagl ...
- Kafka集群监控工具之二--Kafka Eagle
基于kafka: kafka_2.11-0.11.0.0.tgz kafka-eagle-bin-1.2.1.tar.gz 1.下载解压 tar -zxvf kafka-eagle-bin-1.2.1 ...
- Kafka学习之(七)搭建kafka可视化服务Kafka Eagle
一.下载安装包 kafka-eagle-bin-1.2.4.tar.gz 百度云链接:链接:https://pan.baidu.com/s/1SNIkpsvs20A_Ljtx5PaMuA 密码:o4 ...
- 使用canal获取mysql的binlog传输给kafka,并交由logstash获取实验步骤
1. 实验环境 CPU:4 内存:8G ip:192.168.0.187 开启iptables防火墙 关闭selinux java >=1.5 使用yum方式安装的java,提前配置好JAVA_ ...
- Kafka Eagle 安装
Kafka Eagle 是一款开源的 Kafka 集群监控系统. 一.下载 https://download.kafka-eagle.org/ 二.安装 # 解压 .tar.gz -C /opt/ / ...
- 使用kafka-eagle监控Kafka
# 监控kafka集群,开启监控趋势图使用 # 有一个问题,需要在kafka-server-start.sh文件中配置端口,有如下三种办法 # 第一种:复制并修改kafka目录,比如kafka-1,k ...
- Kafka Eagle安装详情及问题解答
1.概述 最近有很多同学给笔者留言,说在安装Kafka Eagle的时候,会遇到一些问题,请教如何解决?今天笔者就在这里总结一下安装步骤,和一些安装的注意事项,以及解决方式. 2.内容 在安装Kafk ...
随机推荐
- Mybatis自定义拦截器与插件开发
在Spring中我们经常会使用到拦截器,在登录验证.日志记录.性能监控等场景中,通过使用拦截器允许我们在不改动业务代码的情况下,执行拦截器的方法来增强现有的逻辑.在mybatis中,同样也有这样的业务 ...
- 全网最值得推荐的ELKB日志学习博客-博客地址留存
博客地址:https://elasticstack.blog.csdn.net/article/details/102728604 博客地址留存,后续解决疑难问题
- 构建之法与CI/CD
项目 内容 这个作业属于哪个课程 2021春季软件工程(罗杰 任健) 这个作业的要求在哪里 个人阅读作业2 我在这个课程的目标是 认识软工,拥抱软工,提升相关能力以便日后与其朝夕相伴 这个作业在哪个具 ...
- MySQL实战45讲,丁奇带你搞懂
之前,你大概都是通过搜索别人的经验来解决问题.如果能够理解MySQL的工作原理,那么在遇到问题的时候,是不是就能更快地直戳问题的本质? 以实战中的常见问题为切入点,带你剖析现象背后的本质原因.为你串起 ...
- 「HTML+CSS」--自定义加载动画【015】
前言 Hello!小伙伴! 首先非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出- 哈哈 自我介绍一下 昵称:海轰 标签:程序猿一只|C++选手|学生 简介:因C语言结识编程,随后转入计算机 ...
- poi 操作 PPT,针对 PPTX--图表篇
poi 操作 PPT,针对 PPTX--图表篇 目录 poi 操作 PPT,针对 PPTX--图表篇 1.读取 PPT 模板 2.替换标题 4.替换图表数据 接下来对 ppt 内的图表进行操作,替换图 ...
- Day07_37_深度剖析集合中的contains()方法
深度剖析集合中的 contains()方法 contains()方法查找集合中是否包含某个元素 contains() 底层使用的是 equals()方法 当contains()方法拿到一个对象的时候, ...
- JMeter 实战案例
案例1:博客网站后端测试 案例2:JPetStore 应用 案例1:博客网站后端测试 测试目标 测试博客网站后端的常用 HTTP 接口的访问方法. 展示 HTTP 请求的各类使用方法. 展示提取 JS ...
- .NET6 平台系列4 .NET开源之路
系列目录 [已更新最新开发文章,点击查看详细] .NET平台是微软于2000年推出的Windows操作系统的应用软件开发框架,发展至今形成巨大的技术栈,涉及多语言(支持C#.F#.VB.NET ...
- ES系列(三):网络通信模块解析
ES是一个分布式搜索引擎,其除了用户提供必要的通信服务外,集群间也必须保持紧密的通信联系,才能在必要的时候给出正确的结果.其则必然涉及到各种繁多且要求高的通信场景,那么如何实现高性能的通信,则是其必须 ...