kafka producer partitions分区器(七)

　　消息在经过拦截器、序列化后，就需要确定它发往哪个分区，如果在ProducerRecord中指定了partition字段，那么就不再需要partitioner分区器进行分区了，如果没有指定，那么会根据key来将数据进行分区，如果partitioner和key都没有指定，那么就会采用默认的方式进行数据分区。

　　有没有指定partition可以从源码中看出：

 public ProducerRecord(String topic, Integer partition, K key, V value) {}

 如果指定的partition,那就指定了数据发往哪个分区上，如果没有就会根据key来进行数据分区，如果2个都没有，那么会采用默认的分区策略来进行数据分区

1.根据key进行分区

public class CustomPartitioner {

    private static final Logger LOG = LoggerFactory.getLogger(CustomPartitioner.class);

    public static void main(String[] args) {

        //1.加载配置信息

        Properties prop = loadProperties();

        //2.创建生产者

        KafkaProducer<Integer,String> producer = new KafkaProducer<>(prop);

        String sendContent = "hello_kafka";

        IntStream.range(0, 10).forEach(i ->{

            try {

                ProducerRecord<Integer,String> record = new ProducerRecord<>("test1",i,sendContent+"_"+i);　　//topic key value

                Future<RecordMetadata> future = producer.send(record);

                RecordMetadata recordMetadata = future.get();

                LOG.info("发送的数据是 :{},offset:是{},partition是：{}",sendContent,recordMetadata.offset(),recordMetadata.partition());

            } catch (Exception e) {

                e.printStackTrace();

            }

        });

    }

     //配置文件的设置

    public static Properties loadProperties() {

        Properties prop = new Properties();

        prop.put("bootstrap.servers", "192.168.100.144:9092,192.168.100.145:9092,192.168.100.146:9092");

        prop.put("key.serializer", "org.apache.kafka.common.serialization.IntegerSerializer");

        prop.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        prop.put("acks", "all");    //发送到所有的ISR队列中

        return prop;

    }

}

2.自定义分区

　　同样在使用自定义分区的时候，需要写实现类和在producer中配置引用

　　我们在这个示例中，根据key来分区，key在序列化的时候用的是IntegerSerializer,在ProducerRecord中我们没有指定partition

　　自定义分区器

public class CustomPartition implements Partitioner{

    @Override

    public void configure(Map<String, ?> configs) {

        // TODO Auto-generated method stub

    }

    @SuppressWarnings({ "null", "unused" })

    @Override

    public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {

        int partitionNum = cluster.partitionsForTopic(topic).size();

        int partition = (Integer)key%partitionNum;

        return key == null? 0:partition;

    }

    @Override

    public void close() {

        // TODO Auto-generated method stub

    }

}

　　生产者

public class ProducerDemo {

    private static final Logger LOG = LoggerFactory.getLogger(ProducerDemo.class);

    public static void main(String[] args) throws InterruptedException, ExecutionException {

        //1.加载配置信息

        Properties prop = loadProperties();

        //2.创建生产者

        KafkaProducer<Integer,String> producer = new KafkaProducer<>(prop);

        //3.发送内容

        String sendContent = "hello_kafka";

        IntStream.range(0, 10).forEach(i ->{

            try {

                ProducerRecord<Integer,String> record = new ProducerRecord<>("test1",i,sendContent+"_"+i);

                Future<RecordMetadata> future = producer.send(record);

                RecordMetadata recordMetadata = future.get();

                LOG.info("发送的数据是 :{},offset:是{},partition是：{}",sendContent,recordMetadata.offset(),recordMetadata.partition());

            } catch (Exception e) {

                e.printStackTrace();

            }

        });

        producer.close();    //回调拦截器中的close方法

    }

    //配置文件的设置

    public static Properties loadProperties() {

        Properties prop = new Properties();

        prop.put("bootstrap.servers", "192.168.100.144:9092,192.168.100.145:9092,192.168.100.146:9092");

        prop.put("key.serializer", "org.apache.kafka.common.serialization.IntegerSerializer");

        prop.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        prop.put("partitioner.class", "com.zpb.partitioner.CustomPartition");

        prop.put("acks", "all");

        return prop;

    }

}

kafka producer partitions分区器(七)的更多相关文章

玩转Kafka的生产者——分区器与多线程
上篇文章学习kafka的基本安装和基础概念,本文主要是学习kafka的常用API.其中包括生产者和消费者, 多线程生产者,多线程消费者,自定义分区等,当然还包括一些避坑指南. 首发于个人网站:链接地址 ...
kafka producer interceptor拦截器(五)
producer在发送数据时,会经过拦截器和序列化,最后到达相应的分区.在经过拦截器时,我们可以对发送的数据做进步的处理. 要正确的使用拦截器需要以下步骤: 1.实现拦截器ProducerInterc ...
kafka 自定义分区器
package cn.xiaojf.kafka.producer; import org.apache.kafka.clients.producer.Partitioner; import org.a ...
Kafka producer拦截器（interceptor）
Kafka producer拦截器(interceptor) 拦截器原理 Producer拦截器(interceptor)是在Kafka 0.10版本被引入的,主要用于实现clients端的定制化控制 ...
Kafka Producer源码解析一：整体架构
一.Producer整体架构 Kafka Producer端的架构整体也是一个生产者-消费者模式 Producer线程调用send时,只是将数据序列化后放入对应TopicPartition的Deque ...
详解Kafka Producer
上一篇文章我们主要介绍了什么是 Kafka,Kafka 的基本概念是什么,Kafka 单机和集群版的搭建,以及对基本的配置文件进行了大致的介绍,还对 Kafka 的几个主要角色进行了描述,我们知道,不 ...
kafka partition（分区）与 group
kafka partition(分区)与 group 一. 1.原理图 2.原理描述一个topic 可以配置几个partition,produce发送的消息分发到不同的partition中,co ...
kafka partition（分区）与 group(转)
原文 https://www.cnblogs.com/liuwei6/p/6900686.html 一. 1.原理图 2.原理描述一个topic 可以配置几个partition,produce发送 ...
Kafka producer介绍
Kafka 0.9版本正式使用Java版本的producer替换了原Scala版本的producer.本文着重讨论新版本producer的设计原理以及基本的使用方法. 新版本Producer 首先明确 ...

随机推荐

053_修改 Linux 系统的最大打开文件数量
#!/bin/bash#往/etc/security/limits.conf 文件的末尾追加两行配置参数,修改最大打开文件数量为 65536 cat >> /etc/security/li ...
五十八.Kibana使用、 Logstash配置扩展插件
1.导入数据批量导入数据并查看 1.1 导入数据 1) 使用POST方式批量导入数据,数据格式为json,url 编码使用data-binary导入含有index配置的json文件 ]# ...
路由器配置——基于链路的OSPF的MD5口令认证
一.实验目的:掌握基于链路的OSPFMD5口令认证二.拓扑图: 三.具体步骤配置: (1)R1路由器的配置 Router>enable Router#configure terminal En ...
文件描述符、文件表项、V节点表项的一些总结
转自 http://blog.csdn.net/gzzheyi/article/details/7739556 表格可以参见APUE 第三版 P61. 文件描述符(进程级别): 1).在每个进程表中 ...
while练习
题目:企业发放的奖金根据利润提成.利润(I)低于或等于10万元时,奖金可提10%:利润高于10万元,低于20万元时,低于10万元的部分按10%提成,高于10万元的部分,可提成7.5%:20万到40万之 ...
C#控制台输入输出
C#控制台输入输出 Console.Read()方法: //从控制台窗口读取一个字符,返回int值 Console.ReadLine()方法: // 从控制台窗口读取一行文本,返回string值 Co ...
BZOJ 4734 UOJ #269 如何优雅地求和 (多项式)
题目链接 (BZOJ) https://www.lydsy.com/JudgeOnline/problem.php?id=4734 (UOJ) http://uoj.ac/problem/269 题解 ...
关于rsa公钥格式的处理，一行纯内容进行换行格式化
最近在开发百度小程序,他的平台公钥是纯字符串,公钥的内容,没有rsa文件的头(-----BEGIN PUBLIC KEY-----)和尾部分-----END PUBLIC KEY----- 但是 PH ...
oracle查询历史执行语句
SELECT * FROM v$sqlarea WHERE PARSING_SCHEMA_NAME='GAVIN' and SQL_TEXT LIKE '%delete%' ORDER BY LAST ...
Apache Flink - 分布式运行环境
1.任务和操作链下面的数据流图有5个子任务执行,因此有五个并行线程. 2.Job Managers, Task Managers, Clients Job Managers:协调分布式运行,他们安排 ...

kafka producer partitions分区器(七)

kafka producer partitions分区器(七)的更多相关文章

随机推荐

热门专题