1.hive介绍 hive是一个数据仓库的解决方案,它的数据存储依赖于HDFS,数据结算依赖于MR,也就是说,hive就是一个在数据仓库的服务,它只需要安装到一台普通的PC上即可,仅仅对外提供SQL服务(和hadoop.hbase.spark.storm不同,应为这些都是分布式服务),对客户端的SQL最终转换成对HDFS的操作和MR的操作. hive有两种作用,第一就是是一个数据仓库,他对数据的组织,比如说表.分区等目录结构,第二就是他的SQL实现是基于Mapreduce. 所以,现在hive组