前言 项目中运用了Spark进行Kafka集群下面的数据消费,本文作为一个Spark入门文章/笔记,介绍下Spark基本概念以及MapReduce模型 Spark的基本概念: 官网: http://spark.apache.org/ 给出了如下概念 Apache Spark™ is a unified analytics engine for large-scale data processing. Apache Spark™是用于大规模数据处理的统一分析引擎.当然,它也适用于AI人工智能. A