什么是RDD 视频教程: 1.优酷 2.YouTube RDD是个抽象类,全称为Resilient Distributed Datasets,是一个容错的.并行的数据结构,可以让用户显式地将数据存储到磁盘和内存中,并能控制数据的分区.同时,RDD还提供了一组丰富的操作来操作这些数据,诸如map.flatMap.filter等转换操作,除此之外,RDD还提供了诸如join.groupBy.reduceByKey等更为方便的操作,以支持常见的数据运算.但实际上继承RDD的派生类一般只要实现两个方法:…