Overview HBase中的一个big table,首先会按行划分成一些region(这些region之间是有序的,由startkey保证),每个region分配到不同的节点进行存储.因此,region是HBase分布式和负载均衡的最小单元. 对每个节点而言,它会对分配到的region是按列族进行存储的.也即,region被分为多个store(对应多个列族).而store内部,又有一个memStore和多个storeFiles组成. 数据首先更新到memStore,memStore会内排序,…