1 基本概念 1.1 什么是分区 Hive查询中一般会扫描整个表内容,会消耗很多时间.有时候只需要查询表中的一部分数据,因此建表时引入了partition(分区)概念. 表中的一个 Partition 对应于表下的一个目录,所有的 Partition 的数据都存储在对应的目录中,因此,使用分区,很容易对数据进行部分查询. 1.2 分区特点 一个表可以拥有一个或者多个分区,每个分区以文件夹的形式单独存在表文件夹的目录下: 表和列名不区分大小写: 分区是以字段的形式在表结构中存在,通过describ