hive 虽然自带了很多函数,但是毕竟有限,无法满足所有业务场景,用户可以自定义函数来实现特定功能 UDF user define function,用户自定义函数 可以分为 3 类 UDF:一进一出 UDAF:聚集函数,多进一出,user define aggregation function UDTF:炸裂函数,一进多出 UDF 可以用多种语言实现,如 java.python.hive 准备工作 建表 create external table person( name string, id…