1.spark的算子分为转换算子和Action算子,Action算子将形成一个job,转换算子RDD转换成另一个RDD,或者将文件系统的数据转换成一个RDD 2.Spark的算子介绍地址:http://spark.apache.org/docs/2.3.0/rdd-programming-guide.html 3.Spark操作基本步骤[java版本,其他语言可以根据官网的案例进行学习] (1)创建配置文件,将集群的运行模式设置好,给作业起一个名字,可以使用set方法其他配置设入. SparkC…