spark源码位置:https://github.com/apache/spark Spark Core核心RDD及编程 什么是RDD:1.是一个抽象类不能直接使用,在子类中实现抽象方法是一个抽象类不能直接使用,在子类中实现抽象方法2.带泛型的,可以支持多种类型:例如可以传入string,person,user3.弹性分布式数据集,一个不可变的,可并行操作的元素分区集合 RDD都有五个主要特性:1.-分区列表:一个RDD由多个分区(partition)构成2.-计算每个分区(partition)