管理kafka
主题操作
1.在集群里创建一个主题需要用到3个参数。这些参数是必须提供的,尽管有些已经有broker级别的默认值。
主题名字,想要创建的主题的名字,主题名字可以包含字母,数字,下划线以及英文状态下破折号和句号。
复制系数,主题的副本数量
分区,主题的分区数量
指定主题配置
可以在创建时显式地指定复制系数或者对配置进行覆盖,通过向kafka-topic.sh 传递 --config参数来实现的。
主题创建的格式
kafka-topics.sh --zookeeper <zookeeper connect> --create --topic <string> --relipcation-fact <integer> -- partition <integer>
如果为集群指定了基于机架信息的副本分配策略,那么分区的副本会分布在不同的架构上。如果不需要基于架构信息的分配策略,可以指定参数 --disable-rack-aware
增加分区
kafak-topics.sh --zookeeper <zookeeper connect> --alter --topic <String> --partitions <integer>
只能增加分区,不能删除分区,如果删除分区,会导致数据不一致。
删除主题
如果一个主题不再使用,只要它还存在集群里面,就会占用一定数量的磁盘空间和文件句柄,把它删除就可以释放被占用的资源。为了能删除主题,broker的delete.topic.enable 参数必须设置为true,如果该参数被设置为false,删除主题的请求会被忽略。
kafka-topics.sh --zookeeper <zookeeper connect> --delete --topic <String>
列出集群里的所有主题
可以使用主题工具列出集群里的所有主题。每个主题占用一行输出,主题之间没有特定的顺序。
kafka-topic.sh --zookeeper <zookeeper connect> --list
列出主题详细信息
kafka-topic.sh --zookeeper <zookeeper connect> --describe
使用topics-with-overrides 参数可以找出所有包含覆盖配置的主题,它只会列出包含了与集群不一样的主题
有两个参数可用于找出有问题的分区。
使用--under-replicated-partitions 参数可以列出所有包含不同步副本的分区。
使用 --unavailable-partitions 参数可以列出所有没有首领的分区,这些分区已经处于离线状态,对于生产者和消费者来说是不可用的。
消费者群组
在kafka里,有两个地方保存着消费者群组的信息。对于旧版本的消费来说,它们的信息保存在Zookeeper上。对于新版本的消费者来说,它们的信息保存在broker上,kafka-consumer-group.sh 工具可以用于列出上述两种消费者群组。它也可以用于删除消费者群组和偏移量信息,不过这个功能仅限于旧版本的消费者群组(信息保存在Zookeeper上),在对于旧版本的消费者仅限操作时,需要通过--zookeeper参数来指定Zookeeper的地址;对于新的 则需要指定 --bootstrap-server参数来指定broker的主机名和端口。
列出旧版本的消费者群组
kafka-consumer-groups.sh --zookeeper <zookeeper connect> --list
列出新版本的消费者群组
kafka-consumer-grous.sh --new-consumer --bootstrap-server <kafka connect> --list
列出的任意群组来说 使用 --describe 代替 --list.
消费者群组的详细信息
Group 消费者群组的名字
Topic 正在被读取的主题名字
Partition 正在被读取的分区ID
Current-offset 消费者群组最近提交的偏移量,也就是说在分区里去读取的当前位置。
log-end-offset 当前高水位偏移量,也就是最近一被读取消息的偏移量,同时也是最近一个提交到集群的偏移量
lag 消费者的current-offset 和broker的log-end-offset之间的差距
owner 消费者群组里正在读取该分区的消费者。这个一个消费者的id,不一定包含消费者的主机名。
消费群组
只有旧版本的消费者客户端才支持删除群组的操作。删除群组操作将从zookeeper上移除整个群组,包括所有已保存的偏移量。
kafka-consumer-groups.sh --zookeeper <zookeeper connect> --delete --group <String>
该命令也可以用于不删除整个群组的情况下删除单个主题的偏移量,再次强调,在进行删除操作之前,需要先关闭消费者,或者不要让它们读取即将被删除的主题。
kafka-consumer-groups.sh --zookeeper <zookeeper connect> --delete --group <String> --topic <String>
偏移量管理
1.导出偏移量
kafka-run-class.sh kafka.tools.ExportZkOffsets --zkconnect <zookeeper connect> --group <String> --output -file <String>
2.导入偏移量
先关闭消费者,如果消费者活跃状态,那么可能会将导入的偏移量被覆盖
kafka-run-class.sh kafka.tools.ImportZkOffsets --zkconnet <zookeeper connect> --input-file <String>
覆盖主题的默认配置
kafka-configs.sh --zookepper <zookepper connect> --alter --entity-type topic --entity-name <topic name> --and-config <key>=<value>,<key>=<value>
覆盖客户端的默认配置
kafka-configs.sh --zookeeper <zookeeper connect> --alter --entity clients --entity-name <client id> and -config <key>=<value>,<key>=<value>
列出被覆盖的配置
kafka-config.sh --zookeeper <zookeeper connect> --describe --entity-type topics --entity-name my-topic
移除被覆盖的配置
删除主题的某一个配置
kafka-configs.sh --zookeeper <zookeeper connect> -alter --entity-type topics --entity-name <topic name> --delete-config <参数名>
分区管理
自动首领再均衡
kafka-preferred-replica-election.sh --zookeeper<zookeeper connect>
修改分区副本
使用kafka-reassign-partitions.sh
这个工具分为步来修改分区
1.根据broker清单和主题清单生产一组迁移步骤
2.执行这些迁移步骤。
3.第三步是可选的,可以使用生成的迁移步骤验证分区重分配的进度和完成情况。
获取json
kafak-reassgin-partitions.sh --zookeeper<zookeeper connect> --generate --topic-to-move-json-file topics.json --broker -list 0,1
修改执行json
kafka-reassgin-partitions.sh --zookeeper<zookeeper connect> --execute --reassignment-json-file topic.json
显示重新分区的情况
kafka-reassgin-partitions.sh --zookeeper<zookeeper connect> --verify --reassignment-json-file topic.json
修改复制系数 从上面步骤中获取json,修改复制系数,执行
转储日志片段
kafka-run-class.sh kafka.tools.DumplogSegments --files <log name>
验证索引文件的正确性使用 --index-sanity-check
验证副本
kafka-replica-verfycation.sh --broker-list <kafka connect>,<kafka connect> --topic-while-list <主题名>
消费者和生产者借助kafka-console-consumer.sh 和kafka-console-producer.sh
指定待读取的主题3个可用的参数 --topic --whilelist --blacklist 后面两个跟着一个正则表达式。
使用旧版消费者读取单个主题
kafka-console-consumer.sh --zookeeper <zookepper connect> --topic <tipic name>
控制台消费者其他常用配置如下:
--formatter className 指定消息格式化器的类名,用于解码消息 默认值是kafka.tools.DefaultFormatter
--form-beginning 指定从最旧的偏移量开始读取数据,否则从最新的偏移量开始读取。
--max-message Num 指定在推出之前最多读取NUM个消息。
--partition NUM 指定只读取ID 为NUM的分区(需要新版本的消费者)。
读取偏移量主题 使用这个格式化器读取kafka.coordinator.GroupMetadataManager$OFFsetsMessageFormatter
kafka-console-consumer.sh --zookeeper <zookeeper connect> --topic __consumer_offsets --formatter kafka.coordinator.GroupMetadataManager$OFFsetsMessageFormatter
控制台生产者
向主题生成两个消息
kafka-console-prodecer.sh --broker-list <kafka connect> --topic <topic name>
客户端ACL
命令行工具kafka-acls.sh可以用于处理客户端访问控制相关的问题。
取消分配重分配
1.发起重分配请求
2.集群控制器将分区添加到broker上
3.新的broker开始复制分区,直到副本达到同步状态
4.集群控制器从分区副本清单里移除旧的broker.
手动删除主题
1.关闭集群里所有的broker
2.删除zookeeper路径/broker/topics/TOPISCNAME,注意要先删除节点下的子节点。
3.删除每个broker的分区目录,这些目录的名字可能是TOPICNAME-NUM 其中NU是指定分区的ID.
4.重启所有的broker.
1.关闭集群里所有的broker
2.删除zookeeper路径/broker/topics/TOPISCNAME,注意要先删除节点下的子节点。
3.删除每个broker的分区目录,这些目录的名字可能是TOPICNAME-NUM 其中NU是指定分区的ID.
4.重启所有的broker.
- kafka学习笔记:知识点整理
一.为什么需要消息系统 1.解耦: 允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束. 2.冗余: 消息队列把数据进行持久化直到它们已经被完全处理,通过这一方式规避了数据丢失风险. ...
- [Big Data - Kafka] kafka学习笔记:知识点整理
一.为什么需要消息系统 1.解耦: 允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束. 2.冗余: 消息队列把数据进行持久化直到它们已经被完全处理,通过这一方式规避了数据丢失风险. ...
- Python Tutorial 学习(八)--Errors and Exceptions
Python Tutorial 学习(八)--Errors and Exceptions恢复 Errors and Exceptions 错误与异常 此前,我们还没有开始着眼于错误信息.不过如果你是一 ...
- Kafka学习-简介
Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用.目前越来越多的开源分布式处理系统如Cloudera.Apache Storm.S ...
- Kafka学习-入门
在上一篇kafka简介的基础之上,本篇主要介绍如何快速的运行kafka. 在进行如下配置前,首先要启动Zookeeper. 配置单机kafka 1.进入kafka解压目录 2.启动kafka bin\ ...
- Kafka学习之路
一直在思考写一些什么东西作为2017年开篇博客.突然看到一篇<Kafka学习之路>的博文,觉得十分应景,于是决定搬来这“他山之石”.虽然对于Kafka博客我一向坚持原创,不过这篇来自Con ...
- kafka学习2:kafka集群安装与配置
在前一篇:kafka学习1:kafka安装 中,我们安装了单机版的Kafka,而在实际应用中,不可能是单机版的应用,必定是以集群的方式出现.本篇介绍Kafka集群的安装过程: 一.准备工作 1.开通Z ...
- kafka 学习资料
kafka 学习资料 kafka 学习资料 网址 kafka 中文教程 http://orchome.com/kafka/index
- SVG 学习<八> SVG的路径——path(2)贝塞尔曲线命令、光滑贝塞尔曲线命令
目录 SVG 学习<一>基础图形及线段 SVG 学习<二>进阶 SVG世界,视野,视窗 stroke属性 svg分组 SVG 学习<三>渐变 SVG 学习<四 ...
随机推荐
- DB2常用指令
1. 启动实例(db2inst1): db2start 2. 停止实例(db2inst1): db2stop 3. 列出所有实例(db2inst1) db2ilist 3-1.列出当前实例: db2 ...
- encode()和decode()两个函数
编码可以将抽象字符以二进制数据的形式表示,有很多编码方法,如utf-8.gbk等,可以使用encode()函数对字符串进行编码,转换成二进制字节数据,也可用decode()函数将字节解码成字符串:用d ...
- oracle基本语句(第五章、数据库逻辑存储结构管理)
1.使用SYS用户以SYSDBA身份登录到SQL Plus,使用视图V$TABLESPACE查看表空间信息 SELECT * FROM V$TABLESPACE; 2.查看视图DBA_TABLESPA ...
- 如何修改 tomcat 端口号?
一.tomcat默认端口 tomcat默认的端口是8080,还会占用8005,8009和8443端口.如果已经启动了tomcat,再启动另一个tomcat就会发现 这些端口已经被占用了,这个时候就需要 ...
- java文件断点续传的简单实现
一.概述 所谓断点续传,其实只是指下载,也就是要从文件已经下载的地方开始继续下载.在以前版本的HTTP协议是不支持断点的,HTTP/1.1开始就支持了.一般断点下载时才用到Range和Content- ...
- BZOJ 4399: 魔法少女LJJ 线段树合并 + 对数
Description 在森林中见过会动的树,在沙漠中见过会动的仙人掌过后,魔法少女LJJ已经觉得自己见过世界上的所有稀奇古怪的事情了LJJ感叹道“这里真是个迷人的绿色世界,空气清新.淡雅,到处散发着 ...
- 【学习小记】Berlekamp-Massey算法
Preface BM算法是用来求一个数列的最短线性递推式的. 形式化的,BM算法能够对于长度为n的有穷数列或者已知其满足线性递推的无穷数列\(a\),找到最短的长度为m的有穷数列\(c\),满足对于所 ...
- Vue(核心思想)
1.Es6语法普及 let和var的区别: var:定义变量时,在全局范围内都有效;所以在变量没有声明之前就能使用,值为undefined, 称为变量提升; let:声明的变量一定要在声明后使用,而且 ...
- 【Leetcode】最长回文子串
启发 1)做题前一定要读懂题目 在本题中,首先要清楚地定义回文子串的概念,然后才能设计算法查找它. 如中心扩散法,其主要思想在于找到一个回文子串的定义——两侧互为镜像.进一步分为奇数长度和偶数长度进行 ...
- JMS学习八(ActiveMQ消息持久化)
ActiveMQ的消息持久化机制有JDBC,AMQ,KahaDB和LevelDB,还有一种内存存储的方式,由于内存不属于持久化范畴,而且如果使用内存队列,可以考虑使用更合适的产品,如ZeroMQ.所以 ...