spark累计器 因为task的执行是在多个Executor中执行,所以会出现计算总量的时候,每个Executor只会计算部分数据,不能全局计算. 累计器是可以实现在全局中进行累加计数. 注意: 累加器只能在driver端定义,driver端读取,不能在Executor端读取. 广播变量只能在driver端定义,在Executor端读取,Executor不能修改. 下面是实践的代码: package SparkStreaming; import org.apache.commons.collec…