aggregate aggregate 是比较常用的 行动 操作,不是很好懂,这里做个解释. aggregate(zeroValue, seqOp, combOp) zeroValue 是一个初始值,自己根据实际情况进行设定: 首先我们知道 RDD 是被分区,然后并行操作的: seqOp 是对每个分区进行聚合,每个分区聚合结果作为 combOp 的输入: combOp 对分区聚合结果再次进行聚合: seqOp 和 combOp 必须有且仅有2个参数 示例如下 seqOp: 把初始值设为 0,累加…