Storm实时流处理Hello World

近来在看Storm的相关资料，以下总结一下配置过程和Hello World例子。

Storm是分布式的实时计算系统。详细文档可参考Storm网站，也可以参阅《Getting started with storm》，以下程序示例即来自于这本书。

先看配置(可参考这里)：

配置文件在下载安装包中的conf文件夹，名字为storm.yaml

########### These MUST be filled in for a storm configuration

storm.zookeeper.servers:

     - "server1"

#     - "server2"

#

nimbus.host: "server1"

storm.local.dir: "/storm/data"

supervisor.slots.ports:

    - 6700

    - 6701

    - 6702

    - 6703

#

# ##### These may optionally be filled in:

#

## List of custom serializations

# topology.kryo.register:

#     - org.mycompany.MyType

#     - org.mycompany.MyType2: org.mycompany.MyType2Serializer

#

## List of custom kryo decorators

# topology.kryo.decorators:

#     - org.mycompany.MyDecorator

#

## Locations of the drpc servers

# drpc.servers:

#     - "server1"

#     - "server2"

## Metrics Consumers

# topology.metrics.consumer.register:

#   - class: "backtype.storm.metrics.LoggingMetricsConsumer"

#     parallelism.hint: 1

#   - class: "org.mycompany.MyMetricsConsumer"

#     parallelism.hint: 1

#     argument:

#       - endpoint: "metrics-collector.mycompany.org"

其中nimbus.host: "server1"指定storm集群中master的主机名为server1，storm.zookeeper.servers指定storm所需要的zookeeper服务器主机名为server1（装在同一服务器上），supervisor.slots.ports指定storm集群中worker使用的socket端口。

其中storm的命令如下所示，分别对应启动master，worker和ui，zookeeper服务请参考zookeeper介绍。

#storm nimbus

#storm spuervisor

#storm ui

ui可以通过浏览器访问以下网址：http://server1:8080/，如下图所示：

从ui可以监测系统运行情况，可以手动控制topology的运行。

再看一下如果编译运行计算任务程序，以下例子来自于《Getting started with storm》，可以从这里下载源代码。示例程序通过maven编译，对应的编译配置文件为pom.xml，为了适配storm新版本。做了如下修改（调依赖整storm的版本为0.8.0）：

编译的命令为(不编译测试脚本)：

#mvn compile -Dmaven.test.skip=true

打包：

#mvn package

打包文件放置在target目录，共有两个，一个包含依赖，一个不包含依赖。storm限制storm库相关jar文件不能打包到最终jar文件，所以将storm依赖项配置修改为如下内容（当然可以直接使用jar命令打包）：

                <dependency>

                        <groupId>storm</groupId>

                        <artifactId>storm</artifactId>

                        <version>0.8.0</version>

                        <!-- keep storm out of the jar-with-dependencies -->

                        <scope>provided</scope>

                </dependency>

<scope>provided</scope>限定最终包含依赖的jar文件不会包含storm。

示例中的TopologyStarter.java文件做如下修改，即将LocalCluster.submitTopology调用替换为StormSubmitter.submitTopology，将计算以集群方式提交。

命令如下所示：

#storm jar mypackage-with-dependencies.jar storm.analytics.TopologyStarter

任务提交后，可以从ui监控其执行状态。

storm涉及的相关理论在后续文章中整理，以上文字作为随笔记录备做后续参考，以防重复劳动。

以上使用storm 0.9.1

Storm实时流处理Hello World的更多相关文章

Storm分布式实时流计算框架相关技术总结
Storm分布式实时流计算框架相关技术总结 Storm作为一个开源的分布式实时流计算框架,其内部实现使用了一些常用的技术,这里是对这些技术及其在Storm中作用的概括介绍.以此为基础,后续再深入了解S ...
Storm实时计算：流操作入门编程实践
转自:http://shiyanjun.cn/archives/977.html Storm实时计算:流操作入门编程实践 Storm是一个分布式是实时计算系统,它设计了一种对流和计算的抽象,概念比 ...
Storm概念学习系列之什么是实时流计算？
不多说,直接上干货! 什么是实时流计算? 1.实时流计算背景 2.实时计算应用场景 3.实时计算处理流程 4.实时计算框架什么是实时流计算? 所谓实时流计算,就是近几年由于数据得到广泛应用之后 ...
Storm简介——实时流式计算介绍
概念实时流式计算: 大数据环境下,流式数据将作为一种新型的数据类型,这种数据具有连续性.无限性和瞬时性.是实时数据处理所面向的数据类型,对这种流式数据的实时计算就是实时流式计算. 特征实时流式计算 ...
Spark入门实战系列--7.Spark Streaming（上）--实时流计算Spark Streaming原理介绍
[注]该系列文章以及使用到安装包/测试数据可以在<倾情大奉送--Spark入门实战系列>获取 .Spark Streaming简介 1.1 概述 Spark Streaming 是Spa ...
【慕课网实战】Spark Streaming实时流处理项目实战笔记二之铭文升级版
铭文一级: 第二章:初识实时流处理需求:统计主站每个(指定)课程访问的客户端.地域信息分布地域:ip转换 Spark SQL项目实战客户端:useragent获取 Hadoop基础课程 ==&g ...
.Spark Streaming（上）--实时流计算Spark Streaming原理介
Spark入门实战系列--7.Spark Streaming(上)--实时流计算Spark Streaming原理介绍 http://www.cnblogs.com/shishanyuan/p/474 ...
实时流计算Spark Streaming原理介绍
1.Spark Streaming简介 1.1 概述 Spark Streaming 是Spark核心API的一个扩展,可以实现高吞吐量的.具备容错机制的实时流数据的处理.支持从多种数据源获取数据,包 ...
kafka实时流数据架构
初识kafka https://www.cnblogs.com/wenBlog/p/9550039.html 简介 Kafka经常用于实时流数据架构,用于提供实时分析.本篇将会简单介绍kafka以及它 ...

随机推荐

Scrum Meeting---Two(2015-10-26)
这次会议主要有两个方面一.讨论项目经过我们团队的激烈讨论,我们团队决定专注于做二手交易这一块.即将之前决定要做的学习经验交流以及校园交由这两块删除. 二.后两天的任务规划以下便是我们的任务规划: ...
I2总线
I2C简介飞利浦(PHILIPS)公司开发的两线式串行总线每个器件都有一个唯一的地址识别 1.只要求两条总线线路:一条串行数据线SDA,一条串行时钟线SCL 2.每个连接到总线的器件都可以通过唯一 ...
[转载] 数据库分析手记 —— InnoDB锁机制分析
作者:倪煜 InnoDB锁机制常常困扰大家,不同的条件下往往表现出不同的锁竞争,在实际工作中经常要分析各种锁超时.死锁的问题.本文通过不同条件下的实验,利用InnoDB系统给出的各种信息,分析了锁的工 ...
jQuery的选择器小总结
这一节详细的总结jQuery选择器. 一.基础选择器 $('#info'); // 选择id为info的元素,id为document中是唯一的,因此可以通过该选择器获取唯一的指定元素 $('.in ...
(一)MII/MDIO接口详解
本文主要分析MII/RMII/SMII,以及GMII/RGMII/SGMII接口的信号定义,及相关知识,同时本文也对RJ-45接口进行了总结,分析了在10/100模式下和1000M模式下的设计方法. ...
Volley框架的流程图分析
接着上一篇Volley框架的使用,这一篇主要主要讲Volley框架运作的原理.主要使用流程图来叙述,简单的分析了整个流程的过程,具体的请参考源代码或者查看我上一篇在文章末尾添上的链接. 一 ...
SDL2.0的SDL_Event事件处理
SDL_Event事件集合 SDL_AudioDeviceEvent SDL_ControllerAxisEvent SDL_ControllerButtonEvent SDL_ControllerD ...
Java 数据类型之间的转换拆分字符串 Date/Calendar的转换
数据类型转换 1. String - Int String str="123"; int i=1; int str=Integer.parseInt(str); String i= ...
例题：超市买东西的程序。输入商品信息，计算价格，价格满多少元打折。这道题用到结构体，集合，for循环，if else语句
知识要点: 集合和数组的区别:数组是连续的,同一类型的一块区域,而集合可以是不连续的,多种数据类型的. 集合属性:.count 方法:.Add() 将对象添加到ArrayList中实际包含的元素数 ...
1.3 ASP.NET MVC生命周期
ASP.NET MVC的执行生命周期主要分为三个阶段,分别是网址路由对比.执行控制器与动作.执行视图并返回结果.从ASP.NET MVC接受HTTP请求到返回HTTP响应的过程如下图所示.

Storm实时流处理Hello World

Storm实时流处理Hello World的更多相关文章

随机推荐

热门专题