Apache Storm 1.1.0 中文文档 | ApacheCN
前言

Apache Storm 是一个免费的,开源的,分布式的实时计算系统.
官方文档: http://storm.apache.org
中文文档: http://storm.apachecn.org
ApacheCN 最近组织了翻译 Storm 1.1.0 中文文档 的活动,整体 翻译进度 为 96%.
感谢大家参与到该活动中来
感谢无私奉献的 贡献者,才有了这份 Storm 1.1.0 中文文档
感谢一路有你的陪伴,我们才可以做的更好,走的更快,走的更远,我们一直在努力 。。。
网页地址: http://storm.apachecn.org/releases/cn/1.1.0/
github: https://github.com/apachecn/storm-doc-zh
如果您有任何意见建议,问题反馈,或者也想参与该翻译,或者想成为该项目的负责人,麻烦联系企鹅: 1042658081
技术交流企鹅群: 214293307
学习方法
Storm 怎么学习,怎么入门 ?
我只能悄悄的告诉你,跟着中文文档走,把文档看一遍先,文档中的概念,例子什么的先弄懂,基本上就入门了
Storm 如何成为大神呢?
先看看大佬们的 blog 学习下,多在群里面跟别人讨论下
文档内容目录
NOTE(注意)
在最新版本中, class packages 已经从 "backtype.storm" 改变成 "org.apache.storm" 了, 所以使用旧版本编译的 topology 代码不会像在 Storm 1.0.0 上那样运行了. 通过以下配置提供向后的兼容性
client.jartransformer.class: "org.apache.storm.hack.StormShadeTransformer"
如果要运行使用较旧版本 Storm 编译的代码, 则需要在 Storm 安装中添加上述配置. 该配置应该添加到您用于提交 topologies(拓扑)的机器中.
Storm 基础
- Javadoc
- 概念
- 调度器
- 配置
- 保证消息处理
- Daemon(守护进程)容错
- 命令行 client(客户端)
- REST API
- 理解 Storm topology 的 parallelism(并行度)
- FAQ
Layers on Top of Storm
Storm Trident
Trident 是 Storm 的另一个 interface(接口).
它提供了 exactly-once(仅且一次)处理, "transactional(事务性的)" datastore persistence(数据存储持久化), 以及一些常见的 stream analytics operations(流式分析操作).
- Trident 教程 -- 基础的概念和预排工作
- Trident API 概述 -- 针对 transforming(转换)和 orchestrating 数据的操作
- Trident State(状态) -- exactly-once(仅且一次)处理以及 fast(快速的), persistent aggregation(持久化的聚合)
- Trident spouts -- transactional(事务性的)和 non-transactional(非事务性的)数据引入
- Trident RAS API -- 与 Trident 一起使用 Resource Aware Scheduler .
Storm SQL
该 Storm SQL 的集成可以让用户在 Storm 的 streaming data(流式数据)上来运行 SQL 查询.
NOTE(注意): Storm SQL 是一个 experimental(实验性的) 功能, 所以 Storm SQL 的结构和所支持的功能在以后可能会发生变化.
但是小的变化不会影响用户体验. 在引入 UX 更改时, 我们会及时通知用户.
Flux
Storm 安装和部署
- 安装一个 Storm 集群
- Local mode(本地模式)
- 问题排查
- 在生产 cluster(集群)上运行 topologies(拓扑)
- 构建 Storm with Maven
- 安装 Secure(安全的)Cluster(集群)
- CGroup 的实施
- Pacemaker 针对大集群减低在 zookeeper 上的负载
- Resource Aware Scheduler(资源意识调度器)
- Daemon Metrics/Monitoring(守护进程的度量/监控)
- Windows 平台的用户指南
Storm 中级
- Serialization(序列化)
- Common patterns(常见模式)
- Clojure DSL
- 与 Storm 一起使用非 JVM 的语言
- 分布式的 RPC
- Transactional topologies(事务性的拓扑)
- Hooks(钩子)
- Metrics(度量)
- State Checkpointing
- Windowing(窗口操作)
- Joining Streams
- Blobstore(Distcahce)
Storm 调试
Storm 与外部系统, 以及其它库的集成
- Apache Kafka 集成, 新的 Kafka Consumer(消费者)集成
- Apache HBase 集成
- Apache HDFS 集成
- Apache Hive 集成
- Apache Solr 集成
- Apache Cassandra 集成
- JDBC 集成
- JMS 集成
- Redis 集成
- Event Hubs 集成
- Elasticsearch 集成
- MQTT 集成
- Mongodb 集成
- OpenTSDB 集成
- Kinesis 集成
- Druid 集成
- Kestrel 集成
Container, Resource Management System Integration
Storm 高级
- 为 Storm 定义非 JVM 语言的 DSL
- 多语言协议(如何为其它语言提供支持)
- 实现文档
结束感言

翻译过程中,大家有说有笑,有时候大家自己也不太懂,关键字啥的都会搞错,完全看不懂,一脸懵逼,醉了 。。。
但总算是把这份中文文档给弄好了吧,也算是对大家,或者对自己有一个交代,没有半途而废吧!~~~
希望大家可以一起走的更快,走的更远 。。。
如果您有任何意见建议,问题反馈,或者也想参与该翻译,或者想成为该项目的负责人,麻烦联系企鹅: 1042658081
技术交流企鹅群: 214293307
Apache Storm 1.1.0 中文文档 | ApacheCN的更多相关文章
- Apache Spark 2.2.0 中文文档
Apache Spark 2.2.0 中文文档 - 快速入门 | ApacheCN Geekhoo 关注 2017.09.20 13:55* 字数 2062 阅读 13评论 0喜欢 1 快速入门 使用 ...
- Apache Spark 2.2.0 中文文档 - 概述 | ApacheCN
Spark 概述 Apache Spark 是一个快速的, 多用途的集群计算系统. 它提供了 Java, Scala, Python 和 R 的高级 API,以及一个支持通用的执行图计算的优化过的引擎 ...
- Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames and Datasets Guide | ApacheCN
Spark SQL, DataFrames and Datasets Guide Overview SQL Datasets and DataFrames 开始入门 起始点: SparkSession ...
- Apache Spark 2.2.0 中文文档 - SparkR (R on Spark) | ApacheCN
SparkR (R on Spark) 概述 SparkDataFrame 启动: SparkSession 从 RStudio 来启动 创建 SparkDataFrames 从本地的 data fr ...
- Apache Spark 2.2.0 中文文档 - Structured Streaming 编程指南 | ApacheCN
Structured Streaming 编程指南 概述 快速示例 Programming Model (编程模型) 基本概念 处理 Event-time 和延迟数据 容错语义 API 使用 Data ...
- Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames and Datasets
Spark SQL, DataFrames and Datasets Guide Overview SQL Datasets and DataFrames 开始入门 起始点: SparkSession ...
- Apache Spark 2.2.0 中文文档 - Spark RDD(Resilient Distributed Datasets)论文 | ApacheCN
Spark RDD(Resilient Distributed Datasets)论文 概要 1: 介绍 2: Resilient Distributed Datasets(RDDs) 2.1 RDD ...
- Apache Spark 2.2.0 中文文档 - Spark 编程指南 | ApacheCN
Spark 编程指南 概述 Spark 依赖 初始化 Spark 使用 Shell 弹性分布式数据集 (RDDs) 并行集合 外部 Datasets(数据集) RDD 操作 基础 传递 Functio ...
- Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南 | ApacheCN
Spark Streaming 编程指南 概述 一个入门示例 基础概念 依赖 初始化 StreamingContext Discretized Streams (DStreams)(离散化流) Inp ...
随机推荐
- 支持苹果IPV6 ONLY 的socket 修改方法
首先别错误理解以为app 必须支持 ipv6 的服务端, 只需要支持 ipv6的客户端需要访问 ipv4 的服务端. 目前需要经过 NAT64 转换就能达到目的,客户端只需要支持该转换就能实现, 在 ...
- Ambari安装之部署本地库(镜像服务器)(二)
部署本地库(镜像服务器) (1)下载HortWorks官网上的3个库到本地(也可以在线下载,但是速度会很慢) 我们先把hortworks官网上需要下载的3个库下载到本地(这个还是需要很长时间的,当然你 ...
- 【NOIP模拟】Grid(字符串哈希)
题目背景 SOURCE:NOIP2016-RZZ-1 T3 题目描述 有一个 2×N 的矩阵,矩阵的每个位置上都是一个英文小写字符. 现在需要从某一个位置开始,每次可以移动到一个没有到过的相邻位置,即 ...
- DL4NLP——词表示模型(一)表示学习;syntagmatic与paradigmatic两类模型;基于矩阵的LSA和GloVe
本文简述了以下内容: 什么是词表示,什么是表示学习,什么是分布式表示 one-hot representation与distributed representation(分布式表示) 基于distri ...
- (转)每天一个linux命令(50):crontab命令
场景:在学习Linux环境下自动部署项目时候,可以通过crontab命令设定定时任务,实现服务端项目的自动部署! 前一天学习了 at 命令是针对仅运行一次的任务,循环运行的例行性计划任务,linux系 ...
- python之二维码生成
生成的二维码只是网址的链接 直接上代码: import qrcode title = input("要生成的内容:") img = qrcode.make(title) with ...
- docker在Centos上的安装
Centos6安装docker 系统:centos6.5 内核:3.10.107-1(已升级),docker对RHEL/Centos的最低内核支持是2.6.32-431,epel源的docker版本推 ...
- Redux源码分析之applyMiddleware
Redux源码分析之基本概念 Redux源码分析之createStore Redux源码分析之bindActionCreators Redux源码分析之combineReducers Redux源码分 ...
- spring持久类po或者javabean为什么常常实现序列化?
无论用hibernate或者mybatis结合spring做开发还是其他,系统里持久类往往要实现序列化, implements Serializable.我还是比较好奇,为什么要这样做呢?一直只知道个 ...
- 求m区间内的最小值
洛谷P1440 求m区间内的最小值 ............................................................................... 以上 ...