在鞋厂的第一个任务,拆表.需要把订单表按照开始日期和结束日期拆分成多条记录,挺新鲜的~ transform方式,使用到了python. (1)把hive表的数据传入,通过python按照日期循环处理,返回多条记录. (2)生成序列表,然后采用cross join的方式,在hive端生成多条记录,再根据日期和序列进行处理. udf方式,更容易操作,我个人习惯使用Java.udf传入开始日期和结束日期,返回时间范围的数组. 再通过lateral view的方式处理. 另外,针对这个需求,对比了cro…