(一)spark特点: 1.高效,采用内存存储中间计算结果,并通过并行计算DAG图的优化,减少了不同任务之间的依赖,降低了延迟等待时间. 2.易用,采用函数式编程风格,提供了超过80种不同的Transformation和Action算子,如map,reduce,filter,groupByKey,sortByKey,foreach等. 3.通用,提供批处理.交互式查询(Spark SQL).实时流处理(Spark Streaming).机器学习(Spark MLlib)和图计算(GraphX).…