聚合内置功能DataFrames提供共同聚合,例如count(),countDistinct(),avg(),max(),min(),等.虽然这些功能是专为DataFrames,spark SQL还拥有类型安全的版本,在其中的一些 scala 和 Java使用强类型数据集的工作.而且,用户可以预定义的聚合函数,也可以创建自己自定义的聚合函数. 1, 非类型化的用户定义的聚合函数 用户必须扩展UserDefinedAggregateFunction 抽象类来实现自定义的非类型集合函数.例如,用户定…