项目的数据分析过程在hadoop集群上实现,主要应用hive数据仓库工具,因此,采集并经过预处理后的数据,需 要加载到hive数据仓库中,以进行后续的挖掘分析. ETL:用来描述将数据从来源端经过抽取(extract).交互转换(transform).加载(load)至目的端的过程 6.1创建原始数据表 --在hive仓库中建贴源数据表 drop table if exists shizhan.ods_weblog_origin; create table shizhan.ods_weblog_…