【大数据】Linux下Storm（0.9版本以上）的环境配置和小Demo

一、引言：

　　在storm发布到0.9.x以后，配置storm将会变得简单很多，也就是只需要配置zookeeper和storm即可，而不再需要配置zeromq和jzmq，由于网上面的storm配置绝大部分都是0.9以前的storm版本，所以有很多工作是不需要进行的，下面就storm的0.9.5版本在linux环境下进行配置进行详细解析。

　　由于配置storm只需要两个步骤，大大简化了配置，也是storm团队做了很大的努力，让程序员们专注于程序，让storm配置进行异常简单，好了，废话说了不少，下面正式开始讲解。

二、配置zookeeper

　　1.打开shell，可以根据自身的习惯设置下载文件的位置信息，使用如下命令进行下载(下载3.4.6版本，此版本位稳定版)：

　　wget http://mirrors.hust.edu.cn/apache/zookeeper/zookeeper-3.4.6/zookeeper-3.4.6.tar.gz

　　2.下载完成后，使用如下命令进行解压缩：

　　tar -zxvf zookeeper-3.4.6.tar.gz

　　会出现一个名为zookeeper-3.4.6的文件夹

　　3.进入zookeeper-3.4.6的conf文件夹，复制zoo_sample.cfg，重命名为zoo.cfg

　　4.修改zoo.cfg的内容，添加的内容如下：　

　　dataDir=/home/leesf/program/zookeeper/data　　　　//（注释：放置数据信息）
　　dataLogDir=/home/leesf/program/zookeeper/log　　　　//（注释：放置日志信息）

　server.1=127.0.0.1:2888:3888　　　　//（注释：使用本地模式，如果有多个机器，可以进行配置（server.1=xxx.xxx.xxxx:xxxx:xxxx 　　　　　　　　　　

　　　　　　　　　　　　　　　　　　　　//server.2=xxx.xxx.xxx:xxxx:xxxx ....））

　　5.在shell命令行里进入zookeeper-3.4.6/bin目录，使用如下命令可以开启、测试、停止zookeeper服务

　　./zkServer.sh start　　　　//（注释：开启服务）

　　./zkServer.sh status　　　　//（注释：查看状态）

　　./zkServer.sh stop　　　　//（停止服务）

　　截图如下：

三、配置storm

　　1.下载storm，使用如下命令下载storm文件

　　wget http://mirrors.hust.edu.cn/apache/storm/apache-storm-0.9.5/apache-storm-0.9.5.tar.gz

　　2.进行解压缩，使用如下命令

　　tar -zxvf apache-storm-0.9.5.tar.gz

　　解压缩后出现文件夹apache-storm-0.9.5

　　3.修改apache-storm-0.9.5/conf目录中的storm.yaml文件

　　添加的内容如下：　

　　# storm.zookeeper.servers:
　　# - "127.0.0.1"
　　#
　　# nimbus.host: "127.0.0.1"
　　#
　　# storm.zookeeper.port:2181
　　#
　　# storm.local.dir: "/home/leesf/program/storm/data"
　　#
　　# supervisor.slots.ports:
　　# -6700
　　# -6701
　　# -6702
　　# -6703

　　4.进入到apache-storm-0.9.5/bin目录下，启动nimbus、supervisor、ui，使用如下命令进行启动：

　　./storm nimbus

　　./storm supervisor

　　./storm ui

　　截图如下：

　　5.在浏览器中查看storm ui信息，打开浏览器输入127.0.0.1:8080即可查看

　　截图如下：

至此，storm的配置就完成了。

下面使用storm的本地模式来运行一个小的Demo，方便各位园友查看storm的运行效果

四、Storm Demo示例

　　storm demo的目录结构如下

　　　　1.spout包，数据发射源

　　　　2.bolt包，数据处理节点

　　　　3.main包，程序执行入口

　　　　4.words.txt，程序资源文件

　　分为如下几个步骤：

　　1.添加源代码：

　　　　1.spout包中包含一个java文件，WordReader.java，具体代码如下：　　　

package com.leesf.Spout;

import java.io.BufferedReader;

import java.io.FileNotFoundException;

import java.io.FileReader;

import java.util.Map;

import backtype.storm.spout.SpoutOutputCollector;

import backtype.storm.task.TopologyContext;

import backtype.storm.topology.OutputFieldsDeclarer;

import backtype.storm.topology.base.BaseRichSpout;

import backtype.storm.tuple.Fields;

import backtype.storm.tuple.Values;

public class WordReader extends BaseRichSpout {

    private SpoutOutputCollector collector;

    private FileReader fileReader;

    private boolean completed = false;

    public void ack(Object msgId) {

        System.out.println("OK:"+msgId);

    }

    public void close() {}

    public void fail(Object msgId) {

        System.out.println("FAIL:"+msgId);

    }

    /**

     * The only thing that the methods will do It is emit each

     * file line

     */

    public void nextTuple() {

        /**

         * The nextuple it is called forever, so if we have been readed the file

         * we will wait and then return

         */

        if(completed){

            try {

                Thread.sleep(1000);

            } catch (InterruptedException e) {

                //Do nothing

            }

            return;

        }

        String str;

        //Open the reader

        BufferedReader reader = new BufferedReader(fileReader);

        try{

            //Read all lines

            while((str = reader.readLine()) != null){

                /**

                 * By each line emmit a new value with the line as a their

                 */

                this.collector.emit(new Values(str),str);

            }

        }catch(Exception e){

            throw new RuntimeException("Error reading tuple",e);

        }finally{

            completed = true;

        }

    }

    /**

     * We will create the file and get the collector object

     */

    public void open(Map conf, TopologyContext context,

            SpoutOutputCollector collector) {

        try {

            this.fileReader = new FileReader(conf.get("wordsFile").toString());

        } catch (FileNotFoundException e) {

            throw new RuntimeException("Error reading file ["+conf.get("wordFile")+"]");

        }

        this.collector = collector;

    }

    /**

     * Declare the output field "word"

     */

    public void declareOutputFields(OutputFieldsDeclarer declarer) {

        declarer.declare(new Fields("line"));

    }

}

　　　　2.bolt包中包含两个java文件，WordCounter.java、WordNormalizer.java，具体代码如下：

　　　　WordCounter.java代码如下：

package com.leesf.Bolt;

import java.util.HashMap;

import java.util.Map;

import backtype.storm.task.TopologyContext;

import backtype.storm.topology.BasicOutputCollector;

import backtype.storm.topology.OutputFieldsDeclarer;

import backtype.storm.topology.base.BaseBasicBolt;

import backtype.storm.tuple.Tuple;

public class WordCounter extends BaseBasicBolt {

    Integer id;

    String name;

    Map<String, Integer> counters;

    /**

     * At the end of the spout (when the cluster is shutdown

     * We will show the word counters

     */

    @Override

    public void cleanup() {

        System.out.println("-- Word Counter ["+name+"-"+id+"] --");

        for(Map.Entry<String, Integer> entry : counters.entrySet()){

            System.out.println(entry.getKey()+": "+entry.getValue());

        }

    }

    /**

     * On create

     */

    @Override

    public void prepare(Map stormConf, TopologyContext context) {

        this.counters = new HashMap<String, Integer>();

        this.name = context.getThisComponentId();

        this.id = context.getThisTaskId();

    }

    @Override

    public void declareOutputFields(OutputFieldsDeclarer declarer) {}

    @Override

    public void execute(Tuple input, BasicOutputCollector collector) {

        String str = input.getString(0);

        /**

         * If the word dosn't exist in the map we will create

         * this, if not We will add 1

         */

        if(!counters.containsKey(str)){

            counters.put(str, 1);

        }else{

            Integer c = counters.get(str) + 1;

            counters.put(str, c);

        }

    }

}

　　　　WordNormalizer.java代码如下：

package com.leesf.Bolt;

import backtype.storm.topology.BasicOutputCollector;

import backtype.storm.topology.OutputFieldsDeclarer;

import backtype.storm.topology.base.BaseBasicBolt;

import backtype.storm.tuple.Fields;

import backtype.storm.tuple.Tuple;

import backtype.storm.tuple.Values;

public class WordNormalizer extends BaseBasicBolt {

    public void cleanup() {}

    /**

     * The bolt will receive the line from the

     * words file and process it to Normalize this line

     *

     * The normalize will be put the words in lower case

     * and split the line to get all words in this

     */

    public void execute(Tuple input, BasicOutputCollector collector) {

        String sentence = input.getString(0);

        String[] words = sentence.split(" ");

        for(String word : words){

            word = word.trim();

            if(!word.isEmpty()){

                word = word.toLowerCase();

                collector.emit(new Values(word));

            }

        }

    }

    /**

     * The bolt will only emit the field "word"

     */

    public void declareOutputFields(OutputFieldsDeclarer declarer) {

        declarer.declare(new Fields("word"));

    }

}

　　　　3.main包中包含一个java文件，Main.java，具体代码如下：

package com.leesf.Main;

import backtype.storm.Config;

import backtype.storm.LocalCluster;

import backtype.storm.topology.TopologyBuilder;

import backtype.storm.tuple.Fields;

import com.leesf.Bolt.*;

import com.leesf.Spout.*;

public class Main {

    public static void main(String[] args) throws InterruptedException {

        //Topology definition

        TopologyBuilder builder = new TopologyBuilder();

        builder.setSpout("word-reader",new WordReader());

        builder.setBolt("word-normalizer", new WordNormalizer())

            .shuffleGrouping("word-reader");

        builder.setBolt("word-counter", new WordCounter(),1)

            .fieldsGrouping("word-normalizer", new Fields("word"));

        //Configuration

        Config conf = new Config();

        conf.put("wordsFile", "/home/leesf/code/eclipse/StormDemo/res/words.txt");

        conf.setDebug(false);

        //Topology run

        conf.put(Config.TOPOLOGY_MAX_SPOUT_PENDING, 1);

        LocalCluster cluster = new LocalCluster();

        cluster.submitTopology("Getting-Started-Toplogie", conf, builder.createTopology());

        Thread.sleep(10000);

        cluster.shutdown();

    }

}

　　　　4.资源文件，words.txt,内容如下：

storm

test

are

great

is

an

storm

simple

application

but

very

powerfull

really

StOrm

is

great

　　　　words.txt可以放在任何地方，相应的程序中的路径也要进行修改，保证路径一致。

　　2.添加依赖库

　　将storm/lib目录下的所有文件添加到本项目中，截图如下：

　　3.运行程序

　　运行程序，可以得到如下的结果：

至此，关于storm的所有配置就已经完成了，下面可以进行相应的storm的开发了。

总结：storm在发布了0.9b版本以后，其配置工作就变得很简单，不再需要配置zeromq和jzmq，现在网上面的配置信息绝大部分都是0.9版本以前的，所以配置显得很累赘，在此记录此次的配置过程，方便各位园友的同时也方便自己以后再去配置这样的信息。在配置的过程中有任何问题也欢迎交流，谢谢各位观看。

参考链接：

http://blog.csdn.net/w13770269691/article/details/38982397

【大数据】Linux下Storm（0.9版本以上）的环境配置和小Demo的更多相关文章

大数据笔记（十七）——Pig的安装及环境配置、数据模型
一.Pig简介和Pig的安装配置 1.最早是由Yahoo开发,后来给了Apache 2.支持语言:PigLatin 类似SQL 3.翻译器 PigLatin ---> MapReduce(Spa ...
R You Ready?——大数据时代下优雅、卓越的统计分析及绘图环境
作者按:本文根据去年11月份CSDN举办的“大数据技术大会”演讲材料整理,最初发表于2012年2月期<程序员>杂志. 0 R 的安装
柯南君：看大数据时代下的IT架构（3）消息队列之RabbitMQ-安装、配置与监控
柯南君:看大数据时代下的IT架构(3)消息队列之RabbitMQ-安装.配置与监控一.安装 1.安装Erlang 1)系统编译环境(这里采用linux/unix 环境) ① 安装环境虚拟机:VMw ...
大数据技术之Hadoop3.1.2版本HA模式
大数据技术之Hadoop3.1.2版本HA模式作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Hadoop的HA特点 1>.主备NameNode 2>.解决单点故障 ...
大数据技术之Hadoop3.1.2版本完全分布式部署
大数据技术之Hadoop3.1.2版本完全分布式部署作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.主机环境准备 1>.操作系统环境 [root@node101.yinz ...
大数据技术之Hadoop3.1.2版本伪分布式部署
大数据技术之Hadoop3.1.2版本伪分布式部署作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.主机环境准备 1>.操作系统环境 [root@node101.yinzh ...
c#中@标志的作用 C#通过序列化实现深表复制细说并发编程-TPL 大数据量下DataTable To List效率对比【转载】C#工具类：实现文件操作File的工具类异步多线程 Async .net 多线程 Thread ThreadPool Task .Net 反射学习
c#中@标志的作用参考微软官方文档-特殊字符@,地址 https://docs.microsoft.com/zh-cn/dotnet/csharp/language-reference/toke ...
柯南君：看大数据时代下的IT架构（5）消息队列之RabbitMQ--案例（Work Queues起航）
二.Work Queues(using the Java Client) 走起在第上一个教程中我们写程序从一个命名队列发送和接收消息.在这一次我们将创建一个工作队列,将用于分发耗时的任务在多个工 ...
柯南君：看大数据时代下的IT架构（4）消息队列之RabbitMQ--案例（Helloword起航）
柯南君:看大数据时代下的IT架构(4)消息队列之RabbitMQ--案例(Helloword起航) 二.起航本章节,柯南君将从几个层面,用官网例子讲解一下RabbitMQ的实操经典程序案例,让大家重 ...

随机推荐

Java中创建对象的几种方式
Java中创建对象的五种方式: 作为java开发者,我们每天创建很多对象,但是我们通常使用依赖注入的方式管理系统,比如:Spring去创建对象,然而这里有很多创建对象的方法:使用New关键字.使用Cl ...
快速学习C语言四: 造轮子，ArrayList
高级语言里的列表是最常用的数据结构,在C里造个轮子玩玩,C没有泛型,先用int练习. Collection的ADT一般有hasnext,next,add, remove操作,List一般还加了remo ...
Grpc微服务从零入门
快速入门安装 JDK 毫无疑问,要想玩Java,就必须得先装Java JDK,目前公司主要使用的是Oracle JDK 8,安装完成后要配置环境才能正常使用,真蠢,不过也就那么一下下,认了吧.配置方 ...
ENode 2.0 - 整体架构介绍
前言今天是个开心的日子,又是周末,可以轻轻松松的写写文章了.去年,我写了ENode 1.0版本,那时我也写了一个分析系列.经过了大半年的时间,我对第一个版本做了很多架构上的改进,最重要的就是让ENo ...
git版本管理策略及相关技巧(A)
公司几乎所有的项目都是使用 git 仓库来管理代码,以前对 git 只有些肤浅的了解,每次提交代码或者上线的时候总是会提心吊胆,生怕出现一些未知的问题.经过三个月的踩坑和填坑, git 操作颇显成熟. ...
NanoProfiler - 适合生产环境的性能监控类库之基本功能篇
背景 NanoProfiler是一个EF Learning Labs出品的免费性能监控类库(即将开源).它的思想和使用方式类似于MiniProfiler的.但是,设计理念有较大差异. MiniProf ...
Hibernate inverse用法（转载）
出处:http://blog.csdn.net/xiaoxian8023/article/details/15380529 一.Inverse是hibernate双向关系中的基本概念.inverse的 ...
IOS Animation-CAShapeLayer、UIBezierPath与Animation的结合
在阅读本文之前,对CAShapeLayer.UIBezierPath不熟悉的话,可以先阅读文章贝塞尔曲线与Layer 如果对动画不熟悉的话,先阅读文章动画基础.深入 Layer是绘图的画板,Bez ...
swift 加载 storyboard 里的UIViewController
let storyBoard:UIStoryboard! = UIStoryboard(name: "Main", bundle: nil) let deskVC:DeskView ...
EF架构~豁出去了,为了IOC,为了扩展,改变以前的IRepository接口
回到目录使用了4年的IRepository数据仓储接口,今天要改变了,对于这个数据仓储操作接口,它提倡的是简洁,单纯,就是对数据上下文的操作,而直正的数据上下文本身我们却把它忽略了,在我的IRepo ...

【大数据】Linux下Storm（0.9版本以上）的环境配置和小Demo

【大数据】Linux下Storm（0.9版本以上）的环境配置和小Demo的更多相关文章

随机推荐

热门专题