场景描述: 公司埋点项目,数据从接口服务写入kafka集群,再从kafka集群消费写入HDFS文件系统,最后通过Hive进行查询输出.这其中存在一个问题就是:埋点接口中的数据字段是变化,后续会有少量字段添加进来.这导致Hive表结构也需要跟着变化,否则无法通过Hive查询到最新添加字段的数据. 解决办法: 为数据表添加字段,字段必须添加到已有字段的最后面.因为已经存在的数据是按照之前的表结构写入到HDFS文件中的,当添加新字段时为了能兼容前面已经存在的数据.在新增的字段加到分区表后,之前已经存在…