今天,我们来进入spark学习的第二章,发现有很多事都已经开始变化,生活没有简单的朝自己想去的方向,但是还是需要努力呀,不说鸡汤之类的话了, 开始我们今天的spark的旅程 一.RDD是什么 rdd的中文解释为弹性分布式数据集,全称Resilient Distributed Datases,即内存中的数据集, RDD只读,可分区,这个数据集的全部或部分可以缓存到内存之中,在多次时间间重用,所谓 弹性,是指内存不够是可以与磁盘进行互换 二.spark算子 spark算子一共分为两类,一类叫做Tra…