1.Hive是Hadoop的一个子项目 利用MapReduce编程技术,实现了部分SQL语句.而且还提供SQL的编程接口.Hive推进Hadoop在数据仓库方面的发展. Hive是一个基于Hadoop文件系统上的数据仓库架构. 主要功能:数据的ETL(抽取,转换,加载)工具,数据存储管理,大型数据集的查询与分析能力. Hive定义了类SQL的语言,Hive QL,它允许用户进行和SQL相似的操作.还允许使用功能mapper和reducer操作. Hadoop是批量处理系统,任务是高延迟性的,所以