我们知道,HBASE在创建表的时候,会自动为表分配一个Region,当一个Region过大达到默认的阈值时(默认10GB大小),HBase中该Region将会进行split,分裂为2个Region,以此类推.表在进行split的时候,会耗费大量的资源,频繁的分区对HBase的性能有巨大的影响.所以,HBase提供了预分区功能,即用户可以在创建表的时候对表按照一定的规则分区. 假设我们初始给它10个Region,那么导入大量数据的时候,就会均衡到10个里面,显然比1个Region要好很多.可是我们