本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是spark第三篇文章,我们继续来看RDD的一些操作. 我们前文说道在spark当中RDD的操作可以分为两种,一种是转化操作(transformation),另一种是行动操作(action).在转化操作当中,spark不会为我们计算结果,而是会生成一个新的RDD节点,记录下这个操作.只有在行动操作执行的时候,spark才会从头开始计算整个计算. 而转化操作又可以进一步分为针对元素的转化操作以及针对集合的转化操作. 针对元素的转化操作…