Hive支持用户自己定义聚合函数(UDAF),这样的类型的函数提供了更加强大的数据处理功能. Hive支持两种类型的UDAF:简单型和通用型.正如名称所暗示的,简单型UDAF的实现很easy,但因为使用了反射的原因会出现性能的损耗,而且不支持长度可变的參数列表等特征.而通用型UDAF尽管支持长度可变的參数等特征.但不像简单型那么easy编写. 这篇文章将学习编写UDAF的规则,比方须要实现哪些接口,继承哪些类,定义哪些方法等. 实现通用型UDAF须要编写两个类:解析器和计算器.解析器负责UDAF