大数据篇:Hive hive.apache.org Hive是什么? Hive是Facebook开源的用于解决海量结构化日志的数据统计,是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并且提供类SQL查询功能,本质是将HQL转化成MapReduce程序. 数据存储在HDFS,分析数据底层实现默认是MapReduce,执行程序运行在Yarn上. 如果没有Hive 想象一下数据统计的时候写大量的MapReduce程序,那会是多么痛苦.如果是写SQL就开心多了,尤其是离线数据