释义 根据RDD中的某个属性进行分组,分组后形式为(k, [(k, v1), (k, v2), ...]),即groupBy 后组内元素会保留key值 方法签名如下: def groupBy[K](f: T => K)(implicit kt: ClassTag[K]): RDD[(K, Iterable[T])] = withScope { ... } f: 分组操作.输入类型为T,操作过程为K,最后RDD形式为K, 迭代器(T)的形式,即同上所述形式 案例 查看每个科目有哪些学生选择 obj…