简单的讲,Apache Spark是一个快速且通用的集群计算系统. Apache Spark 历史: 2009年由加州伯克利大学的AMP实验室开发,并在2010年开源,13年时成长为Apache旗下大数据领域最活跃的开源项目之一.2014年5月底spark1.0.0发布,2016年6月spark2.0发布,至今最近的版本是xxx(看官网). Spark的使用场景: 实时查看浏览统计信息,流式计算,SQL查询,图计算,机器学习. Spark特点: 快速的处理能力.由于spark可以将中间输出和最后…