自定义kafka Sink

package my.bigdata;

/**

 * Created by lq on 2017/8/22.

 */

import java.io.File;

import java.io.FileInputStream;

import java.io.FileNotFoundException;

import java.io.IOException;

import java.util.Map;

import java.util.Properties;

import my.utils.PropertiesUtils;

import org.apache.flume.Channel;

import org.apache.flume.Context;

import org.apache.flume.Event;

import org.apache.flume.EventDeliveryException;

import org.apache.flume.Transaction;

import org.apache.flume.conf.Configurable;

import org.apache.flume.sink.AbstractSink;

import org.apache.kafka.clients.producer.KafkaProducer;

import org.apache.kafka.clients.producer.Producer;

import org.apache.kafka.clients.producer.ProducerRecord;

public class KafkaSink2 extends AbstractSink implements Configurable {

    private static String TOPIC = null;

    private Producer<String, String> producer;

    private static Properties properties = null;

    static {

        final String topicCfg ="topic.cfg";

        final String myKafkaSinkCfg ="myKafkaSink.cfg";

        TOPIC = (String) PropertiesUtils.getPropertiesFromClass(KafkaSink2.class,topicCfg).get("topic");

        properties = PropertiesUtils.getPropertiesFromClass(KafkaSink2.class,myKafkaSinkCfg);

    }

    public Status process() throws EventDeliveryException {

        // TODO Auto-generated method stub

        Channel channel = getChannel();

        Transaction transaction = channel.getTransaction();

        try {

            transaction.begin();

            Event event = channel.take();

            if (event == null) {

                transaction.rollback();

                return Status.BACKOFF;

            }

            Map<String, String> headers = event.getHeaders();

            String logtype = headers.get("logtype");

            //随机

            String random = System.currentTimeMillis() + "";//随机数,key,避免写热点问题

            String kafkaKey = random + "_" + logtype;

            // public ProducerRecord(String topic, K key, V value)

            ProducerRecord<String, String> data = new ProducerRecord<String, String>(

                    TOPIC, kafkaKey, new String(event.getBody()));

            producer.send(data);

            transaction.commit();

            return Status.READY;

        } catch (Exception e) {

            transaction.rollback();

            return Status.BACKOFF;

        } finally {

            transaction.close();

        }

    }

    public void configure(Context arg0) {

        producer = new KafkaProducer<>(properties);

    }

}

package my.bigdata;

import org.apache.kafka.clients.producer.Partitioner;

import org.apache.kafka.common.Cluster;

import java.util.Map;

/**

 * Created by lq on 2017/8/22.

 */

public class kafkaSinkPartitioner implements Partitioner {

    @Override

    public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {

        int parNums = cluster.partitionsForTopic(topic).size();

        try {

            String randomInKey = ((String) key).split("_")[];

            return (int) Math.abs(Long.parseLong(randomInKey) % parNums);

        } catch (Exception e) {

            return Math.abs(key.hashCode() % parNums);

        }

    }

    @Override

    public void close() {

    }

    @Override

    public void configure(Map<String, ?> map) {

    }

}

自定义kafka Sink的更多相关文章

自定义Flume Sink：ElasticSearch Sink
Flume Sink的目的是从Flume Channel中获取数据然后输出到存储或者其他Flume Source中.Flume Agent启动的时候,它会为每一个Sink都启动一个SinkRunner ...
《从0到1学习Flink》—— 如何自定义 Data Sink ？
前言前篇文章 <从0到1学习Flink>-- Data Sink 介绍介绍了 Flink Data Sink,也介绍了 Flink 自带的 Sink,那么如何自定义自己的 Sink 呢 ...
Flink 从 0 到 1 学习 —— 如何自定义 Data Sink ？
前言前篇文章 <从0到1学习Flink>-- Data Sink 介绍介绍了 Flink Data Sink,也介绍了 Flink 自带的 Sink,那么如何自定义自己的 Sink 呢 ...
Flume简介与使用（三）——Kafka Sink消费数据之Kafka安装
前面已经介绍了如何利用Thrift Source生产数据,今天介绍如何用Kafka Sink消费数据. 其实之前已经在Flume配置文件里设置了用Kafka Sink消费数据 agent1.sinks ...
Spring Boot 自定义kafka 消费者配置 ContainerFactory最佳实践
Spring Boot 自定义kafka 消费者配置 ContainerFactory最佳实践本篇博文主要提供一个在 SpringBoot 中自定义 kafka配置的实践,想象这样一个场景:你的系统 ...
基于RobotFramework——自定义kafka库并导入使用
[Kafka] 首先介绍一下我了解的kafka的皮毛信息—— kafka——一个分布流处理系统:流处理:可以像消息队列一样publish或者subscribe信息:分布式:提供了容错性,并发处理消息的 ...
【翻译】Flink Table Api & SQL — 自定义 Source & Sink
本文翻译自官网: User-defined Sources & Sinks https://ci.apache.org/projects/flink/flink-docs-release-1 ...
flume的自定义sink-Kafka
1.创建一个agent,sink类型需指定为自定义sink vi /usr/local/flume/conf/agent3.conf agent3.sources=as1 ...
#研发解决方案介绍#Recsys-Evaluate（推荐评测）
郑昀基于刘金鑫文档最后更新于2014/12/1 关键词:recsys.推荐评测.Evaluation of Recommender System.piwik.flume.kafka.storm.r ...

随机推荐

为什么你学不会递归？告别递归，谈谈我的一些经验关于集合中一些常考的知识点总结 .net辗转java系列（一）视野彻底理解cookie，session，token
为什么你学不会递归?告别递归,谈谈我的一些经验可能很多人在大一的时候,就已经接触了递归了,不过,我敢保证很多人初学者刚开始接触递归的时候,是一脸懵逼的,我当初也是,给我的感觉就是,递归太神奇了! ...
session的取代者:Json Web Tokens----在客户端存储登陆状态
https://auth0.com/blog/2014/01/07/angularjs-authentication-with-cookies-vs-token/
第二篇：呈现内容_第三节：CompositeControl呈现
一.CompositeControl的呈现过程 CompositeControl派生自WebControls,重写了Render(HtmlTextWriter writer)方法.在调用基类WebCo ...
JAVA classpath jar问题[zz]
classpath问题可以说是所有初学者头疼的问题,偶也一样. 1) classpath的作用: 它的作用就事让java找到你所要执行,或你拥有的类. 2) classpath的设置: 设置cla ...
SVN配置钩子文件限制提交文件时必须填写更新日志
进入相应SVN仓库hooks目录,编辑文件pre-commit #!/bin/sh REPOS="$1"TXN="$2" SVNLOOK=/usr/bin/sv ...
Atitit http2 新特性
Atitit http2 新特性性能安全与push Multipexing 多路复用每个 Frame Header 都有一个 Stream ID 就是被用于实现该特性.每次请求/响应使用不同的 ...
PCIe扫盲——一个Memory Read操作的例子
连载目录篇:http://blog.chinaaet.com/justlxy/p/5100053251 前面的一系列文章简要地介绍了PCIe总线的结构.事务层.数据链路层和物理层.下面我们用一个简单地 ...
菜鸟调错（一）——Maven项目部署到Jboss出现：Failed to create a new SAX parser
今天调试的时候遇到一个错误,往Jboss的deploy目录扔war包的时候,报了一个“Failed to create a new SAX parser”的错误.在网上找了找解决方案,一般都说将项目中 ...
nodejs中aes-128-cbc加密和解密
和java程序进行交互的时候,java那边使用AES 128位填充模式:AES/CBC/PKCS5Padding加密方法,在nodejs中采用对应的aes-128-cbc加密方法就能对应上,因为有使用 ...
http缓存机制之304状态码
在网上看到一篇关于解释浏览器缓存更新机制304状态码的文章,里面说如果请求头中的If-Modified-Since字段和If-None-Match字段的值分别和响应头中的Last-Modified字段 ...

自定义kafka Sink

自定义kafka Sink的更多相关文章

随机推荐

热门专题