【kafka】设置指定topic和group

该博文方法有问题，正确方案在http://www.cnblogs.com/dplearning/p/7992994.html

背景：

搭建了一个kafka集群，建立了topic test，用group_id ttt 消耗topic.

但问题是，我消费的处理太慢了，导致了上百万数据的挤压，即offset滞后上百万

现在，想放弃上一次的任务，执行新的任务。但是topic名称和group_id不能变化。

想了几个方案，觉得重置offset是最符合我需求的。

import os

from confluent_kafka import Consumer, KafkaError, TopicPartition

# 获取最大logsize

def get_logsize():

    cmd = "/usr/local/share/applications/kafka/kafka_2.11-0.11.0.0/bin/kafka-run-class.sh kafka.tools.ConsumerOffsetChecker --group ttt --zookeeper x.x.x.x:2181 --topic test"

    res = os.popen(cmd).read()

    logsize = res.split("\n")[1].split()[4]

    return int(logsize)

c = Consumer({'bootstrap.servers': 'x.x.x.x:9092',

              'group.id': 'ttt',

              'default.topic.config': {'auto.offset.reset': 'largest'}})

c.subscribe(['test'])

logsize = get_logsize()

tp = TopicPartition('test', 0, logsize)

c.commit(offsets = [tp])  # 直接将offset置为logsize,跳过未消费的数据

我没找到怎么直接通过confluent_kafka获取logsize.

https://docs.confluent.io/3.0.0/clients/confluent-kafka-python/#configuration 有提到OFFSET_END，但是我用了后OFFSET_END值为-1，并没有将offset置为最新。

只好用命令行获取了.............

方案二（放弃）：删除topic以及所有相关数据。

上网查了查，太复杂了。要删zookeeper和kafka的log文件，还要重启服务。

这跟我想的不一样啊，难道kafka就没有直接清除数据的指令吗.............

整体感受：kafka的API比我想象中少很多，或者是我没找到....

【kafka】设置指定topic和group_id消耗的offset的更多相关文章

Kafka动态增加Topic的副本
一.kafka的副本机制由于Producer和Consumer都只会与Leader角色的分区副本相连,所以kafka需要以集群的组织形式提供主题下的消息高可用.kafka支持主备复制,所以消息具备高 ...
Kafka笔记--指定消息的partition规则
参数的设定:参考资料不错的资料:http://blog.csdn.net/honglei915/article/details/37697655 http://developer.51cto.com ...
Kafka设计解析（十）Kafka如何创建topic
转载自 huxihx,原文链接 Kafka如何创建topic? 目录一.命令行部分二.后台逻辑部分 Kafka创建topic命令很简单,一条命令足矣: bin/kafka-topics. --re ...
Kafka vs RocketMQ—— Topic数量对单机性能的影响-转自阿里中间件
引言上一期我们对比了三类消息产品(Kafka.RabbitMQ.RocketMQ)单纯发送小消息的性能,受到了程序猿们的广泛关注,其中大家对这种单纯的发送场景感到并不过瘾,因为没有任何一个网站的业务 ...
使用Java API创建（create），查看（describe），列举（list），删除（delete）Kafka主题（Topic）
使用Kafka的同学都知道,我们每次创建Kafka主题(Topic)的时候可以指定分区数和副本数等信息,如果将这些属性配置到server.properties文件中,以后调用Java API生成的主题 ...
Kafka中操作topic时 Error:Failed to parse the broker info from zookeeper
Kafka中操作topic时 Error: Failed to parse the broker info from zookeeper 1.问题描述 2.问题原因 kafka在启动后 ...
Kafka vs RocketMQ—— Topic数量对单机性能的影响
引言上一期我们对比了三类消息产品(Kafka.RabbitMQ.RocketMQ)单纯发送小消息的性能,受到了程序猿们的广泛关注,其中大家对这种单纯的发送场景感到并不过瘾,因为没有任何一个网站的业务 ...
一个filebeat实例设置多topic设置
方法1:一实例多topic: https://discuss.elastic.co/t/filebeat-5-0-output-to-kafka-multiple-topics/67934 The d ...
kafka 设置消费者线程数
http://blog.csdn.net/derekjiang/article/details/9053863 分布式发布订阅消息系统 Kafka 架构设计 - 目前见到的最好的Kafka中文文章 M ...

随机推荐

mysql 修改文件记录:
增: insert t1(id, name) values(1, "alex"), (2, "wusir"), (3, "dabing" ...
python小练习---TCP客户端
这是python黑帽子上的起始练习,我对其中的用到的函数做了注释,以便日后便于理解. 该程序可以访问百度,返回响应信息. 另外,我注释还有一部分UDP客户端的语句,TCP和UDP对比便于记忆. # - ...
中国各省市县级 JSON 文件
参考链接:https://blog.csdn.net/lzhlzz/article/details/41347929
ubuntu14.04配置face_recognition环境
Github项目地址:https://github.com/MiChongGET/face_collection 环境搭建 1. 环境 ubuntu14.04 LTS python2.7 pip ...
Django中间件基础笔记
django 中的中间件(middleware),在django中,中间件其实就是一个类,在请求到来和结束后,django会根据自己的规则在合适的时机执行中间件中相应的方法. 在django项目的se ...
openstack Q版部署-----环境搭建（1）
浏览器建议全程使用火狐或者谷歌,不然VNC可能会有问题一.环境准备系统:centos7.2 x86_64 controller 2c+8g+40g 10.1.80.110 可以nat上网 comp ...
java 八种基本数据类型
nginx 端口映射多个应用
nginx端口映射多个应用,应用中的静态资源路径尽量是写相对路径 server { listen 8000; location / { proxy_pass http://10.1.166.216:9 ...
老师博客copy
新闻管理 Py西游攻关之基础数据类型数据类型计算机顾名思义就是可以做数学计算的机器,因此,计算机程序理所当然地可以处理各种数值.但是,计算机能处理的远不止数值,还可以处理文本.图形.音频 ...
Android 正则表达式验证手机号码
方案一:比较精准的判断手机段位,但是随着手机号段的增多要不断的修改正则 public boolean isPhoneNumber1(String phone) { String regExp = &q ...

【kafka】设置指定topic和group_id消耗的offset

【kafka】设置指定topic和group_id消耗的offset的更多相关文章

随机推荐

热门专题