Apache HBase是Hadoop的分布式开源的存储管理工具,很适合随机实时的io操作. 我们知道,Hadoop的Sequence File是一个顺序读写,批量处理的系统.可是为什么HBase能做到随机的,实时的io操作呢? Hadoop底层使用Sequence File文件格式存储,Sequence File同意以追加的方式添加k-v(Key-Value)数据,依据hdfs的append-only的特性,Sequence File不同意改动或删除一个指定的数据.仅仅有append操作是被同…