第一步: 需求分析 需要哪些字段(时间:每一天,各个时段,id,url,guid,tracTime) 需要分区为天/时 PV(统计记录数) UV(guid去重) 第二步: 实施步骤 建Hive表,表列分隔符和文件保持一至 Load数据到Hive表中 写HiveSql进行统计,将结果放入Hive另一张表中(数据清洗) 从Hive的另一张表中的数据导出到Mysql,使用sqoop 网站项目从Mysql读取这张表的信息 预期结果 日期 小时 PV UV 第三步: 实施 # 建源表(注意进入beelin…