storm和kafka整合

依赖

<dependency>

    <groupId>org.apache.storm</groupId>

    <artifactId>storm-kafka-client</artifactId>

    <version>1.2.2</version>

    <scope>provided</scope>

</dependency>

<dependency>

    <groupId>org.apache.kafka</groupId>

    <artifactId>kafka-clients</artifactId>

    <version>2.1.0</version>

</dependency>

<dependency>

    <groupId>org.apache.storm</groupId>

    <artifactId>storm-core</artifactId>

    <version>1.2.2</version>

    <scope>provided</scope>

</dependency>

App

package test;

import java.util.List;

import java.util.concurrent.TimeUnit;

import org.apache.kafka.clients.consumer.ConsumerConfig;

import org.apache.kafka.clients.consumer.ConsumerRecord;

import org.apache.storm.kafka.spout.Func;

import org.apache.storm.kafka.spout.KafkaSpout;

import org.apache.storm.kafka.spout.KafkaSpoutConfig;

import org.apache.storm.kafka.spout.KafkaSpoutRetryExponentialBackoff;

import org.apache.storm.kafka.spout.KafkaSpoutConfig.FirstPollOffsetStrategy;

import org.apache.storm.kafka.spout.KafkaSpoutRetryExponentialBackoff.TimeInterval;

import org.apache.storm.topology.TopologyBuilder;

import org.apache.storm.tuple.Fields;

import org.apache.storm.tuple.Values;

public class App

{

    public static void main( String[] args ) throws Exception{

        KafkaSpoutConfig<String, String> conf = KafkaSpoutConfig

            .builder("worker1:9092,worker2:9092,worker3:9092", "test") // 你的kafka集群地址和topic

            .setProp(ConsumerConfig.GROUP_ID_CONFIG, "consumer") // 设置消费者组，随便写

            .setProp(ConsumerConfig.MAX_PARTITION_FETCH_BYTES_CONFIG, 1024 * 1024 * 4)

            // .setRecordTranslator(new MyRecordTranslator())

            .setRecordTranslator( // 翻译函数，就是将消息过滤下，具体操作自己玩

                    new MyRecordTranslator(),

                    new Fields("word")

                )

            .setRetry( // 某条消息处理失败的策略

                    new KafkaSpoutRetryExponentialBackoff(

                        new TimeInterval(500L, TimeUnit.MICROSECONDS),

                        TimeInterval.milliSeconds(2),

                        Integer.MAX_VALUE,

                        TimeInterval.seconds(10)

                    )

                )

            .setOffsetCommitPeriodMs(10000)

            .setFirstPollOffsetStrategy(FirstPollOffsetStrategy.LATEST)

            .setMaxUncommittedOffsets(250)

            .build();

        TopologyBuilder builder = new TopologyBuilder();

        builder.setSpout("KafkaSpout", new KafkaSpout<String, String>(conf), 1);

        builder.setBolt("Recieve", new RecieveBolt(), 1).globalGrouping("KafkaSpout");

        builder.setBolt("Consume", new ConsumeBolt(), 1).globalGrouping("Recieve");

        builder.createTopology();

        // 集群运行

        // Config config = new Config();

        // config.setNumWorkers(3);

        // config.setDebug(true);

        // StormSubmitter.submitTopology("teststorm", config, builder.createTopology());

        // 本地测试

        // Config config = new Config();

        // config.setNumWorkers(3);

        // config.setDebug(true);

        // config.setMaxTaskParallelism(20);

        // LocalCluster cluster = new LocalCluster();

        // cluster.submitTopology("teststorm", config, builder.createTopology());

        // Utils.sleep(60000);

        // // 执行完毕，关闭cluster

        // cluster.shutdown();

    }

}

class MyRecordTranslator implements Func<ConsumerRecord<String, String>, List<Object>> {

    private static final long serialVersionUID = 1L;

    @Override

    public List<Object> apply(ConsumerRecord<String, String> record) {

        return new Values(record.value());

    }

}

ConsumeBolt

package test;

import java.io.FileWriter;

import java.io.IOException;

import java.util.Map;

import java.util.UUID;

import org.apache.storm.task.OutputCollector;

import org.apache.storm.task.TopologyContext;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.base.BaseRichBolt;

import org.apache.storm.tuple.Tuple;

public class ConsumeBolt extends BaseRichBolt {

    private static final long serialVersionUID = -7114915627898482737L;

    private FileWriter fileWriter = null;

    private OutputCollector collector;

    public void prepare(Map stormConf, TopologyContext context, OutputCollector collector) {

        this.collector = collector;

        try {

            fileWriter = new FileWriter("/usr/local/tmpdata/" + UUID.randomUUID());

            // fileWriter = new FileWriter("C:\\Users\\26401\\Desktop\\test\\" + UUID.randomUUID());

        } catch (IOException e) {

            throw new RuntimeException(e);

        }

    }

    public void execute(Tuple tuple) {

        try {

            String word = tuple.getStringByField("word") + "......." + "\n";

            fileWriter.write(word);

            fileWriter.flush();

            System.out.println(word);

        } catch (IOException e) {

            throw new RuntimeException(e);

        }

    }

    public void declareOutputFields(OutputFieldsDeclarer outputFieldsDeclarer) {

    }

}

RecieveBolt

package test;

import java.util.Map;

import org.apache.storm.task.OutputCollector;

import org.apache.storm.task.TopologyContext;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.base.BaseRichBolt;

import org.apache.storm.tuple.Fields;

import org.apache.storm.tuple.Tuple;

import org.apache.storm.tuple.Values;

public class RecieveBolt extends BaseRichBolt {

    private static final long serialVersionUID = -4758047349803579486L;

    private OutputCollector collector;

    public void prepare(Map stormConf, TopologyContext context, OutputCollector collector) {

        this.collector = collector;

    }

    public void execute(Tuple tuple) {

        // 将spout传递过来的tuple值进行转换

        this.collector.emit(new Values(tuple.getStringByField("word") + "!!!"));

    }

    // 声明发送消息的字段名

    public void declareOutputFields(OutputFieldsDeclarer outputFieldsDeclarer) {

        outputFieldsDeclarer.declare(new Fields("word"));

    }

}

storm和kafka整合的更多相关文章

5 kafka整合storm
本博文的主要内容有 .kafka整合storm .storm-kafka工程 .storm + kafka的具体应用场景有哪些? 要想kafka整合storm,则必须要把这个storm-kafk ...
Flume+Kafka+storm的连接整合
Flume-ng Flume是一个分布式.可靠.和高可用的海量日志采集.聚合和传输的系统. Flume的文档可以看http://flume.apache.org/FlumeUserGuide.html ...
Flume+Kafka整合
脚本生产数据---->flume采集数据----->kafka消费数据------->storm集群处理数据日志文件使用log4j生成,滚动生成! 当前正在写入的文件在满足一定的数 ...
Storm 学习之路（九）—— Storm集成Kafka
一.整合说明 Storm官方对Kafka的整合分为两个版本,官方说明文档分别如下: Storm Kafka Integration : 主要是针对0.8.x版本的Kafka提供整合支持: Storm ...
Storm 系列（九）—— Storm 集成 Kafka
一.整合说明 Storm 官方对 Kafka 的整合分为两个版本,官方说明文档分别如下: Storm Kafka Integration : 主要是针对 0.8.x 版本的 Kafka 提供整合支持: ...
flume与kafka整合
flume与kafka整合前提: flume安装和测试通过,可参考:http://www.cnblogs.com/rwxwsblog/p/5800300.html kafka安装和测试通过,可参考: ...
Storm集成Kafka应用的开发
我们知道storm的作用主要是进行流式计算,对于源源不断的均匀数据流流入处理是非常有效的,而现实生活中大部分场景并不是均匀的数据流,而是时而多时而少的数据流入,这种情况下显然用批量处理是不合适的,如果 ...
storm集成kafka
kafkautil: import java.util.Properties; import kafka.javaapi.producer.Producer; import kafka.produce ...
【转】Spark Streaming和Kafka整合开发指南
基于Receivers的方法这个方法使用了Receivers来接收数据.Receivers的实现使用到Kafka高层次的消费者API.对于所有的Receivers,接收到的数据将会保存在Spark ...

随机推荐

redis、kafka、rabittMQ对比（转）
本文不对三者之间的性能进行对比,只是从三者的特性上区分他们,并指出三者的不用应用场景. 1.publish/subscribe 发布订阅模式如下图所示可以具有多个生产者和发布者,redis.kafka ...
Django进阶Model篇005 - QuerySet常用的API
django.db.models.query.QuerySet QuerySet特点: 1.可迭代 2.可切片查询相关API 1.get(**kwargs):返回与所给的筛选条件相匹配的对象,返回结 ...
同步容器类ConcurrentHashMap及CopyOnWriteArrayList
ConcurrentHashMap Java5在java.util.concurrent包中提供了多种并发容器类来改进同步容器的性能.其中应用最为广泛的为ConcurrentHashMap,Concu ...
ionic2——开发利器之Visual Studio Code 常用插件整理
1.VsCode官方插件地址: http://code.visualstudio.com/docs 2.使用方法,可以在官网中搜索需要的插件或者在VsCode的“”扩展“”中搜索需要的插件添加方法使 ...
Prism开发人员指南5-WPF开发文档翻译（纯汉语版）
2014四月 Prism以示例和文档的形式帮助你更简单的设计丰富灵活易维护的WPF程序.其中使用的设计模式体现了一些重要的设计原则,例如分离关注点和松耦合,Prism帮助你利用松耦合组件设 ...
React 实现 Table 的思考
琼玖 1 年前 (写的零零散散, 包括github不怎么样) Table 是最常用展示数据的方式之一,可是一个产品中往往很多非常类似的 Table, 但是我们碰到的情况往往是 Table A 要排序, ...
旧书重温：0day2【8】狙击windows的异常处理实验
现在进入0day2的第六章内容其中第六章的书本内容我都拍成了图片格式放在了QQ空间中(博客园一张一传,太慢了)http://user.qzone.qq.com/252738331/photo/V10 ...
Ubuntu 中 java 环境 (sunjdk) 的配置 (附详细说明)
暑假以来为了鼓捣双系统废了很大的劲儿,本来一股脑想装 CentOS,无奈怎么处理分区引导都不能成功地与 Win8 共存,最终用 Ubuntu 一句 "检测到系统上有 Windows Boot ...
关于python模拟登录的一点实践
不久前,通过网上查阅各种资料,一直想利用python来实现模拟登录的功能,通过csdn汪海的博客学会了一点,但也只能算个皮毛,亦或皮毛都算不上. 边查阅资料边写一个小东西,起初想写一个程序,通过暴力破 ...
BZOJ - 2460 ：元素（贪心&线性基）
相传,在远古时期,位于西方大陆的 Magic Land 上,人们已经掌握了用魔法矿石炼制法杖的技术.那时人们就认识到,一个法杖的法力取决于使用的矿石.一般地,矿石越多则法力越强,但物极必反:有时,人们 ...

storm和kafka整合

storm和kafka整合

依赖

App

ConsumeBolt

RecieveBolt

storm和kafka整合的更多相关文章

随机推荐

热门专题