Hive概述 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能. Hive本质是:将HQL转化成MapReduce程序. Hive处理的数据存储在HDFS中,分析数据底层的实现可以是MapReduce.tes或者Spark,其执行程序运行在Yarn上. Hive优缺点 优点: 1.使用简单,类SQL语法易于使用. 2.可扩展性,可以随时扩展集群规模. 3.延展性,支持自定义函数. 4.无需开发MapReduce程序. 缺点: 1.效率低延迟…