本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是spark专题第二篇文章,我们来看spark非常重要的一个概念--RDD. 在上一讲当中我们在本地安装好了spark,虽然我们只有local一个集群,但是仍然不妨碍我们进行实验.spark最大的特点就是无论集群的资源如何,进行计算的代码都是一样的,spark会自动为我们做分布式调度工作. RDD概念 介绍spark离不开RDD,RDD是其中很重要的一个部分.但是很多初学者往往都不清楚RDD究竟是什么,我自己也是一样,我在系统学习s…