1. Spark Overview(spark概述) Apache spark是一个快速和通用的集群计算系统.它提供了Java,Scala,Python和R的高级APIs,以及支持通用执行图的优化引擎.它也支持一系列高级工具,包括用于SQL的Spark SQL.结构化数据处理.用于机器学习的MLlib,用于图形处理的GraphX以及Spark Streaming. 2. Downloading(下载) 从项目网址的下载页面下载Spark.这个文档是Spark 2.2.1版本的.Spark使用HD…