Storm整合Kafka Java API源码

1.Maven项目的pom.xml源码如下:

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

    xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">

    <modelVersion>4.0.0</modelVersion>

    <groupId>com.yg</groupId>

    <artifactId>storm</artifactId>

    <version>0.0.1-SNAPSHOT</version>

    <packaging>jar</packaging>

    <name>storm</name>

    <url>http://maven.apache.org</url>

    <properties>

        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>

    </properties>

    <dependencies>

        <dependency>

            <groupId>org.apache.storm</groupId>

            <artifactId>storm-core</artifactId>

            <version>1.1.3</version>

            <scope>provided</scope>

        </dependency>

        <dependency>

            <groupId>org.apache.kafka</groupId>

            <artifactId>kafka_2.12</artifactId>

            <version>0.10.2.1</version>

        </dependency>

        <dependency>

            <groupId>org.apache.storm</groupId>

            <artifactId>storm-kafka</artifactId>

            <version>1.1.3</version>

        </dependency>

    </dependencies>

    <build>

        <plugins>

            <plugin>

                <artifactId>maven-assembly-plugin</artifactId>

                <configuration>

                    <descriptorRefs>

                        <descriptorRef>jar-with-dependencies</descriptorRef>

                    </descriptorRefs>

                    <archive>

                        <manifest>

                            <mainClass>com.path.to.main.Class</mainClass>

                        </manifest>

                    </archive>

                </configuration>

            </plugin>

            <plugin>

                <groupId>org.apache.maven.plugins</groupId>

                <artifactId>maven-compiler-plugin</artifactId>

                <version>3.5</version>

                <configuration>

                    <source>1.8</source>

                    <target>1.8</target>

                </configuration>

            </plugin>

        </plugins>

    </build>

</project>

2.KafkaSpout.java源码如下:

package com.yg.storm.kafka.spouts;

import java.util.Arrays;

import java.util.Map;

import java.util.Properties;

import org.apache.kafka.clients.consumer.ConsumerRecord;

import org.apache.kafka.clients.consumer.ConsumerRecords;

import org.apache.kafka.clients.consumer.KafkaConsumer;

import org.apache.storm.spout.SpoutOutputCollector;

import org.apache.storm.task.TopologyContext;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.base.BaseRichSpout;

import org.apache.storm.tuple.Fields;

import org.apache.storm.tuple.Values;

public class KafkaSpout extends BaseRichSpout {

    private static final long serialVersionUID = 7582771881226024741L;

    private KafkaConsumer<String, String> consumer;

    final private String TOPIC = "myTopic";

    SpoutOutputCollector collector;

    @Override

    public void open(Map conf, TopologyContext context, SpoutOutputCollector collector) {

        this.collector = collector;

        Properties props = new Properties();

        props.put("bootstrap.servers", "hadoop211:9092,hadoop212:9092,hadoop213:9092");

        props.put("group.id", "test");

        props.put("enable.auto.commit", "true");

        props.put("auto.commit.interval.ms", "1000");

        props.put("session.timeout.ms", "30000");

        props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        consumer = new KafkaConsumer<String, String>(props);

        consumer.subscribe(Arrays.asList(TOPIC));

    }

    @Override

    public void nextTuple() {

        try {

            consumer.subscribe(Arrays.asList(TOPIC));//向topic订阅数据

            //无限循环拉取

            while (true) {

                ConsumerRecords<String, String> records = consumer.poll(10);//一次拉取10条数据

                for (ConsumerRecord<String, String> record : records) {

                    String key = record.key();

                    String value = record.value();

                    System.out.printf("offset = %d, key = %s, value = %s", record.offset(), key ,value);

                    collector.emit(new Values(value));//发射数据

                }

                Thread.sleep(1000*1);//每隔一秒拉取一次

            }

        } catch (InterruptedException e) {

            e.printStackTrace();

        } finally {

            consumer.close();

        }

    }

    @Override

    public void declareOutputFields(OutputFieldsDeclarer declarer) {

        // TODO Auto-generated method stub

        declarer.declare(new Fields("sentence"));

    }

}

3.HelloWorldBolt.java源码如下:

package com.yg.storm.bolts;

import java.util.Map;

import org.apache.storm.task.OutputCollector;

import org.apache.storm.task.TopologyContext;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.base.BaseRichBolt;

import org.apache.storm.tuple.Tuple;

public class HelloWorldBolt extends BaseRichBolt{

    /**

     * 功能：就收到spout发送的数据，打印并统计hello world的数量

     * 实现：打印，创建计数变量用于统计hello world

     */

    private static final long serialVersionUID = -5061906223048521415L;

    private int myCount = 0;//计数变量，不能在execute函数中初始化

    private TopologyContext context;//上下文变量

    private OutputCollector collector;

    //相当于spout中的open

    @Override

    public void prepare(Map stormConf,

            TopologyContext context,

            OutputCollector collector) {

        this.context = context;

        this.collector = collector;

    }

    //相当于spout中的nextTuple

    @Override

    public void execute(Tuple input) {

        //拿到数据，用字段名取出

        String text = input.getStringByField("sentence");

        System.out.println("One tuple gets in: " + context.getThisTaskId() + text);

        if ("Hello World".equals(text)){

            myCount++;

            System.out.println("Found a Hello World! My count is now:" + myCount);

        }

        collector.ack(input);//处理完成要通知Storm

//        collector.fail(input);//处理失败要通知Storm    

    }

    @Override

    public void declareOutputFields(OutputFieldsDeclarer declarer) {

    }

}

4.KafkaHelloWorldTopology.java源码如下:

package com.yg.storm.kafka.topologies;

import org.apache.storm.Config;

import org.apache.storm.LocalCluster;

import org.apache.storm.StormSubmitter;

import org.apache.storm.kafka.BrokerHosts;

import org.apache.storm.kafka.KafkaSpout;

import org.apache.storm.kafka.SpoutConfig;

import org.apache.storm.kafka.ZkHosts;

import org.apache.storm.spout.SchemeAsMultiScheme;

import org.apache.storm.topology.TopologyBuilder;

import org.apache.storm.utils.Utils;

import com.yg.storm.bolts.HelloWorldBolt;

public class KafkaHelloWorldTopology {

    //可以向main函数传入一个参数作为集群模式下Topology的名字，如果不传入任何参数则使用本地模式

    public static void main(String[] args) {

            final String brokerZkStr = "hadoop211:2181,hadoop212:2181,hadoop213:2181";

            final String topic  = "myTopic";

            BrokerHosts brokerHosts = new ZkHosts(brokerZkStr);

//          //使用KafkaConfig

//          KafkaConfig kafkaConfig = new KafkaConfig(

//                  brokerHosts,

//                  topic

//                  );

            //使用SpoutConfig，它继承自KafkaConfig，延伸了几个功能配置

            SpoutConfig spoutConfig = new SpoutConfig(

                    brokerHosts, //storm要连接的kafka的对应的zk列表

                    topic, //storm要消费的kafka的topic

                    "/HWTopo", //storm在kafka消费的过程中需要在zk中设置一个工作目录

                    "kafkaspout");  //storm在kafka中消费过程中生产一个标识ID

            //指定自定义的scheme

            spoutConfig.scheme = new SchemeAsMultiScheme(new MessageScheme());

            TopologyBuilder builder = new TopologyBuilder();

            builder.setSpout("spout", new KafkaSpout(spoutConfig));

            builder.setBolt("bolt1", new HelloWorldBolt()).shuffleGrouping("spout");

            Config conf = new Config();

//          Map<String, String> map = new HashMap<String, String>();

//

//          map.put("metadata.broker.list", "hadoop211:9092,hadoop212:9092,hadoop213:9092");

//          map.put("serializer.class", "kafka.serializer.StringEncoder");

//          conf.put("kafka.broker.properties", map);

//          conf.put("topic", topic);

            if(args != null && args.length > 0) {

                //提交到集群运行

                try {

                    StormSubmitter.submitTopology(args[0], conf, builder.createTopology());

                } catch (Exception e) {

                    e.printStackTrace();

                }

            } else {

                //本地模式运行

                LocalCluster cluster = new LocalCluster();

                cluster.submitTopology("SchemeTopo", conf, builder.createTopology());

                Utils.sleep(1000000);

                cluster.killTopology("SchemeTopo");

                cluster.shutdown();

            }

        }

}

5.自定义schema类MessageScheme.java源码如下:

package com.yg.storm.kafka.topologies;

import java.nio.ByteBuffer;

import java.nio.CharBuffer;

import java.nio.charset.Charset;

import java.nio.charset.CharsetDecoder;

import java.util.List;

import org.apache.storm.spout.Scheme;

import org.apache.storm.tuple.Fields;

import org.apache.storm.tuple.Values;

//编写storm消费kafka的逻辑

/*

 * MultiScheme is an interface that dictates how the ByteBuffer consumed

 * from Kafka gets transformed into a storm tuple.

 * It also controls the naming of your output field.

 *

 * The default RawMultiScheme just takes the ByteBuffer and returns a tuple

 * with the ByteBuffer converted to a byte[].

 * The name of the outputField is "bytes".

 * There are alternative implementations like SchemeAsMultiScheme and

 * KeyValueSchemeAsMultiScheme which can convert the ByteBuffer to String.

 *

 */

public class MessageScheme implements Scheme {

    private static final long serialVersionUID = 1033379821285531859L;

    @Override

    public List<Object> deserialize(ByteBuffer buffer) {

        try {

            Charset charset = Charset.forName("UTF-8");

            CharsetDecoder decoder = charset.newDecoder();

            CharBuffer charBuffer = decoder.decode(buffer.asReadOnlyBuffer());

            String sentence = charBuffer.toString();

            return new Values(sentence);

        } catch (Exception e) {

            System.out.println(e);

            return null;

        }

    }

    @Override

    public Fields getOutputFields() {

        return new Fields("sentence");

    }

}

直接本地运行KafkaHelloWorldTopology类即可.

Storm整合Kafka Java API源码的更多相关文章

kafka java API的使用
Kafka包含四种核心的API: 1.Producer API支持应用将数据流发送到Kafka集群的主题 2.Consumer API支持应用从Kafka集群的主题中读取数据流 3.Streams A ...
Android 如何在Eclipse中查看Android API源码及 support包源码
当我们阅读android API开发文档时候,上面的每个类,以及类的各个方法都是已经写好的方法和控件,可是我们只是在搬来使用,不知道它的原理,它是如何被实现的.android系统是开源的,所以谷歌官方 ...
Java集合源码学习（一）集合框架概览
>>集合框架 Java集合框架包含了大部分Java开发中用到的数据结构,主要包括List列表.Set集合.Map映射.迭代器(Iterator.Enumeration).工具类(Array ...
【转】Android 如何在Eclipse中查看Android API源码及 support包源码
原文网址:http://blog.csdn.net/vipzjyno1/article/details/22954775 当我们阅读android API开发文档时候,上面的每个类,以及类的各个方法都 ...
Spring3 + Spring MVC+ Mybatis 3+Mysql 项目整合（注解及源码）
Spring3 + Spring MVC+ Mybatis 3+Mysql 项目整合(注解及源码) 备注: 之前在Spring3 + Spring MVC+ Mybatis 3+Mysql 项目整合中 ...
Java Reference 源码分析
@(Java)[Reference] Java Reference 源码分析 Reference对象封装了其它对象的引用,可以和普通的对象一样操作,在一定的限制条件下,支持和垃圾收集器的交互.即可以使 ...
在Eclipse中关联Android API源码
在Eclipse中快速关联API源码,便于查看类以及方法.方法如下: 1. 在对应的项目文件右键——>properties——>java build path——>libraries ...
Java Collections 源码分析
Java Collections API源码分析侯捷老师剖析了不少Framework,如MFC,STL等.侯老师有句名言: 源码面前,了无秘密这句话还在知乎引起广泛讨论. 我对教授程序设计的一点想 ...
自学Java HashMap源码
自学Java HashMap源码参考:http://zhangshixi.iteye.com/blog/672697 HashMap概述 HashMap是基于哈希表的Map接口的非同步实现.此实现提 ...
Java集合源码分析（三）——LinkedList
简介 LinkedList是一个链表结构的列表,也可以被作为堆栈.队列或双端队列使用.它继承于AbstractSequentialList双向链表,实现了List.Deque.Cloneable.ja ...

随机推荐

基于Expression Lambda表达式树的通用复杂动态查询构建器——《构思篇一》
在上一篇中构思了把查询子句描述出来的数据结构,那么能否用代码将其表达出来,如何表达呢? 再次回顾考察,看下面的查询子句: Id>1 and Id<10 如上所示,有两个独立的条件分别为Id ...
FreeSWITCH添加自定义endpoint
操作系统 :CentOS 7.6_x64 FreeSWITCH版本 :1.10.9 日常开发过程中会遇到需要扩展FreeSWITCH对接其它系统的情况,这里记录下编写FreeSWITCH ...
K8s Pod状态与容器探针
1.pod的调度流程及常见状态 1.1.pod的调度流程 Pod创建过程如上图所示,首先用户向apiserver发送创建pod的请求,apiserver收到用于创建pod请求后,对应会对该用户身份信息 ...
六大云端 Jupyter Notebook 平台测评
有许多方法可以与其他人共享静态 Jupyter 笔记本,例如把它发布在 GitHub 上或通过 nbviewer 链接进行分享. 但是,如果接收人已经安装了 Jupyter Notebook 环境,那 ...
公路堵车概率模型Python（Nagel-Schreckenberg交通流模型）
路面上有N辆车,以不同速度向前行驶,模拟堵车问题.有以下假设: 假设某辆车的当前速度是 v 如果前方可见范围内没车,下一秒车速提高到 v+1 如果前方有车,前车的距离为 d ,且 d < v ...
WPF中控件转命令
WPF不是所有控件都有Command属性,如果窗体需要在ViewModel 使用System.Windows.Interactivity事件在nuget浏览搜索下载System.Windows.I ...
尚医通-day10【微信扫码登录】（内附源码）
第01章-准备工作 1.申请微信登录 https://open.weixin.qq.com (1)注册开发者账号:准备营业执照 (2)邮箱激活 (3)完善开发者资料 (4)开发者资质认证:1-2个工作 ...
LLE算法在自然语言生成中的应用：实现文本到语音的情感迁移
目录自然语言生成(Natural Language Generation,NLP)是人工智能领域的一个分支,它利用大量的文本数据训练出语言模型,从而实现对自然语言的生成和理解.在NLP中,情感迁移( ...
记一次字符串末尾空白丢失的排查 → MySQL 是会玩的！
开心一刻今天答应准时回家和老婆一起吃晚饭,但临时有事加了会班,回家晚了点回到家,本以为老婆会很生气,但老婆却立即从厨房端出了热着的饭菜老婆:还没吃饭吧,去洗下,来吃饭吧我洗好,坐下吃饭,内心感 ...
AI-3线性回归
3.1笔记线性回归假设y与多个x之间的关系是线性的,且噪声符合正态分布. 线性模型则是对输入特征做仿射变换Y^ = W * X+b,其中Y^为预测值,我们希望预测值与真实值Y的误差最小.那如何衡量这 ...

Storm整合Kafka Java API源码

Storm整合Kafka Java API源码的更多相关文章

随机推荐

热门专题