samza是一个分布式的流式数据处理框架(streaming processing),它是基于Kafka消息队列来实现类实时的流式数据处理的.(准确的说,samza是通过模块化的形式来使用kafka的,因此可以构架在其他消息队列框架上,但出发点和默认实现是基于kafka) Apache Kafka主要是用来控制发消息的 Apache Hadoop YARN会提供错误信息,隔离处理器,安全和资源管理. 本文将介绍怎么在 Ubuntu 14.04 的32位 系统上安装Samza. 安装准备: 要安装…