一:RDD的依赖关系 1.在代码中观察 val data = Array(1, 2, 3, 4, 5) val distData = sc.parallelize(data) val resultRDD = distData.flatMap(v => (1 to v)).map(v => (v%2,1)).reduceByKey(_+_) resultRDD.toDebugString ## 查看RDD的依赖情况 2.解释 +—处表示,这是两个不同的stage 同时可以知道shuffledRD…