对RDD的学习进行一下整理 RDD:基于内存的集群计算容错抽象 分布式内存抽象的概念---弹性分布式数据集(RDD),它具备MapReduce等数据流模型的容错特性,并且允许开发人员在大型集群上执行基于内存的计算. 为了有效地实现容错,RDD提供了一种高度受限的共享内存,即RDD是只读的,并且只能通过其他 RDD上的批量操作来创建. RDD基于工作集的应用,同时具有数据流模型的特点:自动容错.位置感知调度和可伸缩性.允许用户在执行多个查询时显式地将工作集缓存在内存中,后续的查询能够重用工作集,提