Storm 使用手册
一、Storm相关术语:
- Nimbus: Storm集群主节点,负责资源的分配和任务的调度
- Supervisor:Storm集群工作节点,接受Nimbus分配的任务,管理Worker
- Worker:Supervisor下的工作进程,具体任务执行
- Task:Worker下的工作线程
- Topology:实时计算逻辑,计算拓扑,由spout和bolt组成的图状结构
- Spout:Storm编程模型中的消息源
- Bolt:Storm编程模型中的处理组件,定义execute方法进行实际的数据逻辑处理
- Stream:拓扑中的消息流,传输的对象是Tuple
- Tuple:一次消息传递的基本单元
一、Storm几个常用的操作命令:
- storm active : 激活指定任务;
- storm drpc:启动一个DRPC进程;
- storm deactivate: 暂停storm的任务;
- storm kill:通过任务名称kill一个任务;
- storm list:列出正在运行的topologies和状态;
- storm nimbus: 启动一个nimbus进程;
- storm supervisor: 启动一个supervisor进程;
- storm ui : 启动监控页面UI的后台进程;
- storm rebalance: 节点扩展后进行负载均衡;
二、Storm编程模型
1、消息源Spout->继承BaseRichSpout类或者实现IRichSpout接口:
- open方法,初始化动作;
- nextTuple方法,消息接入,执行数据的发射;
- ack方法,tuple成功处理后调用;
- fail方法,tuple处理失败时调用;
- declareOutputFields方法,声明输出字段。
2、处理单元Bolt->继承BaseBasicBolt类或者实现IRichBolt接口:
- prepare方法,worker启动时初始化;
- execute方法,接受一个tuple并执行逻辑处理,发射出去;
- cleanup方法,关闭前调用;
- declareOutputFields方法,字段申明。
三、Storm应用实例的实现步骤
1、根据自己业务需求进行方案及拓扑的设计,并通过代码来实现拓扑
2、将编写好的源代码进行打包(最好用maven来操作)
$ mvn package // 这种打包方式将不包含依赖包
$ mvn assembly:assembly //包含依赖包
3、将拓扑提交到集群上运行
$ storm jar [jar包的名称] [包中实现topology的类的地址] [自定义的topology的名称]
4、进行拓扑UI的监控
$ nohup storm ui &
以下是UI界面监控的集群及Topology的情况:
以下是Topology的详细情况:
最后是Storm执行Topology任务后的输出结果:
Storm 使用手册的更多相关文章
- Storm官方帮助手册翻译(下)
使用其他语言编写Bolt Bolt可以使用任意语言编写.用另外一种语言编写Bolt来作为子进程运行.Storm会在标准输入输出的基础上使用Json来与子进程通信.通信协议之需要一个100行的适配器库, ...
- Storm官方帮助手册翻译(上)
Storm作为当前最流行的实时计算框架,自Twitter将其开源后就一直备受关注.由于其具有先天的稳定性以及便捷性,目前被许多大公司所采用,国外像雅虎.雅虎日本.Twitter.OOYALA.Spot ...
- Storm中遇到的日志多次重写问题(一)
业务描述: 统计从kafka spout中读取的数据条数,以及写入redis的数据的条数,写入hdfs的数据条数,写入kafaka的数据条数.并且每过5秒将数据按照json文件的形式写入日志.其中保存 ...
- Storm 实战:构建大数据实时计算
Storm 实战:构建大数据实时计算(阿里巴巴集团技术丛书,大数据丛书.大型互联网公司大数据实时处理干货分享!来自淘宝一线技术团队的丰富实践,快速掌握Storm技术精髓!) 阿里巴巴集团数据平台事业部 ...
- storm源码之storm代码结构【译】【转】
[原]storm源码之storm代码结构[译] 说明:本文翻译自Storm在GitHub上的官方Wiki中提供的Storm代码结构描述一节Structure of the codebase,希望对正 ...
- storm环境搭建
备注——使用: 1.单机版本: 启动zkServer.nimbus.supervisor.ui服务: zkServer.sh start zkServer.sh status #查看zkserver是 ...
- 【原】storm源码之storm代码结构【译】
说明:本文翻译自Storm在GitHub上的官方Wiki中提供的Storm代码结构描述一节Structure of the codebase,希望对正在基于Storm进行源码级学习和研究的朋友有所帮助 ...
- storm入门教程 第一章 前言[转]
1.1 实时流计算 互联网从诞生的第一时间起,对世界的最大的改变就是让信息能够实时交互,从而大大加速了各个环节的效率.正因为大家对信息实时响应.实时交互的需求,软件行业除了个人操作系统之外,数据库 ...
- storm源码之storm代码结构【译】
storm源码之storm代码结构[译] 说明:本文翻译自Storm在GitHub上的官方Wiki中提供的Storm代码结构描述一节Structure of the codebase,希望对正在基于S ...
随机推荐
- kubernetes 每个node上只能运行一个副本DaemonSet
每个node上只能运行一个副本: apiVersion: extensions/v1beta1 kind: DaemonSet #使用DaemonSet的方式运行 metadata: name: ku ...
- PHP——base64的图片的另类上传方法
前言 这只是个暂行的办法,回头研究好七牛云的base64上传或者vue的文件上传后还是要进行更改的 想法是这样的,既然前端只能穿base64的那就传base64的然后转为文件上传到七牛云后再删除 本地 ...
- bzoj 2131 : 免费的馅饼 (树状数组优化dp)
题目链接:https://www.lydsy.com/JudgeOnline/problem.php?id=2131 思路: 题目给出了每个馅饼的下落时间t,和位置p,以及价值v,我们可以得到如下状态 ...
- 洛谷CF809C Find a car(数位DP)
洛谷题目传送门 通过瞪眼法发现,\(a_{i,j}=(i-1)\text{ xor }(j-1)+1\). 二维差分一下,我们只要能求\(\sum\limits_{i=0}^x\sum\limits_ ...
- 自学Python4.7-生成器(方式一:生成器函数)
自学Python之路-Python基础+模块+面向对象自学Python之路-Python网络编程自学Python之路-Python并发编程+数据库+前端自学Python之路-django 自学Pyth ...
- 自学华为IoT物联网_03 公共事业物联网常见问题及解决方案
点击返回自学华为IoT物流网 自学华为IoT物联网_03 公共事业物联网常见问题及解决方案 本文从以下六项公共事业,看看物联网的解决方案: 停车问题 路灯管理问题 消防栓管理问题 井盖管理问题 水表管 ...
- 【CF809C】Find a car(动态规划)
[CF809C]Find a car(动态规划) 题面 洛谷 CF 有一个无穷大的矩阵,第\(i\)行第\(j\)列的数是\((i-1)xor(j-1)+1\),\(q\)次询问,每次询问一个矩形内数 ...
- Graham Scan凸包算法
获得凸包的算法可以算是计算几何中最基础的算法之一了.寻找凸包的算法有很多种,Graham Scan算法是一种十分简单高效的二维凸包算法,能够在O(nlogn)的时间内找到凸包. 首先介绍一下二维向量的 ...
- VSIX 插件右键菜单
vs2017 插件开发 环境 WIN10 VS2017 CMMT VSIX 参考资源: vs菜单命令ID速查 https://docs.microsoft.com/zh-cn/visualstudio ...
- CSS圆角进化论
CSS圆角发展过程 大致经历了3个阶段,包括: 背景图片实现圆角 CSS2.0+标签模拟圆角 CSS3.0圆角属性(border-radius属性)实现圆角 ☛背景图片实现圆角:==使用背景图片实现 ...