一. 为什么hive是数据仓库 hive局限于hdfs, 不能进行记录级别的增删改 hive底层的mapreduce启动耗时很长, 无法做到传统数据库的秒查, 只适合离线分析 hive不支持事务, 无法完成OLTP的要求, OLTP选择hbase或cassandera 二. hive安装 每个hive客户端, 都需要有一个元数据服务来存储元信息(表模式,分区信息), 通常用传统数据库的一个表来存储元信息 hive内部默认用derby存储元信息, 由于derby是单进程存储, 使得不允许两个以上的