Hbase数据读写流程

From:

https://blog.csdn.net/wuxintdrh/article/details/69056188

写操作：

Client写入，存入Memstore，Memstore满则Flush成一个Storefile，Storefile文件数量增长到一定的阈值，触发Compact合并操作，多个Storefile合并成一个Storefile，同时进行版本合并和数据删除，当Storefile compact后，逐步形成越来越大的store file，单个store file大小超过一定的阈值后触发split操作，把当前region分裂为两个region，原来的region下线，新的2个region会被hmaster分配到hregionserver上（负载均衡），使得原先1个Region的压力分流到两个上，Hbase只是增加数据，所有的更新和删除操作都是在COMPACT阶段做的。所以用户操作只需要写入到内存即返回，保证IO性能

写入先memstore, storefile,compact,split

读操作：

Client->zookeeper->.ROOT->.META->用户数据表zookeeper记录了.ROOT的路径信息（root只有一个region），.ROOT理记录了.META的region信息（.META信息可能有多个region）

Hbase中，所有的存储文件都被划分成若干小块存储，这些小存储块在get或scan操作时会加载到内存中

Hbase顺序的读取一个数据块到内存缓存中，其读取相邻的数据时就可以在内存中读取而不是从磁盘中再次读取，减少IO次数

HLog

每个HRegionServer中都会有一个HLog（Write Ahead Log），每次用户操作写入Memstore的同时，也写入一份到HLog文件，该文件定期滚动出新，并删除旧的文件（已经持久化到Storefile中的数据）。当HRegionServer意外终止后，HMaster会通过zookeeper感知，HMaster首先处理遗留的HLog文件，将不同的region的log数据拆分，分别放到相应的region目录下，然后再将失效的region重新分配，领取到这些region的HRegionServer在load region的过程中，会发现有历史的HLog需要处理，因此会replay HLog中的数据到memstore中，然后flush到storefile，完成数据恢复

Hbase数据读写流程的更多相关文章

HBase 数据读写流程
HBase 数据读写流程 2016-10-18 杜亦舒读数据 HBase的表是按行拆分为一个个 region 块儿,这些块儿被放置在各个 regionserver 中假设现在想在用户表中获取 ro ...
HBase数据读写流程（1.3.1）
===数据写入流程=== 源码:https://github.com/apache/hbase/blob/master/hbase-server/src/main/java/org/apache/ha ...
HBase - 数据写入流程解析
本文由网易云发布. 作者:范欣欣本篇文章仅限内部分享,如需转载,请联系网易获取授权. 众所周知,HBase默认适用于写多读少的应用,正是依赖于它相当出色的写入性能:一个100台RS的集群可以轻松 ...
Hbase的读写流程
HBase读写流程 1.HBase读数据流程 HRegionServer保存着meta表以及表数据,要访问表数据,首先Client先去访问zookeeper,从zookeeper里面获取meta表所在 ...
HBase数据存取流程
一.HBase的特点是什么 1.HBase一个分布式的基于列式存储或者行式存储的数据库,基于hadoop的hdfs存储,zookeeper进行管理. 2.HBase适合存储半结构化或非结构化数据,对于 ...
JuiceFS 数据读写流程详解
对于文件系统而言,其读写的效率对整体的系统性能有决定性的影响,本文我们将通过介绍 JuiceFS 的读写请求处理流程,让大家对 JuiceFS 的特性有更进一步的了解. 写入流程 JuiceFS 对大 ...
2.1-2.2 HBase数据存储
一.HBase数据检索流程一篇介绍HBase数据读写流程的解析的博文:http://hbasefly.com/2016/12/21/hbase-getorscan/?wsfatm=uqvhl3 1. ...
HBase 文件读写过程描述
HBase 数据读写过程描述我们熟悉的在 Hadoop 使用的文件格式有许多种,例如: Avro:用于 HDFS 数据序序列化与 Parquet:常见于 Hive 数据文件保存在 HDFS中 HFi ...
【HBase】知识小结+HMaster选举、故障恢复、读写流程
1:什么是HBase HBase是一个高可靠性,高性能,面向列,可伸缩的分布式数据库,提供海量数据存储功能,一个结构化的分布式存储系统,不同于一般的关系型数据库,它适合半结构化和非结构化数据存储. 2 ...

随机推荐

廖雪峰Java1-3流程控制-5循环
while循环 while循环首先判断条件: 条件满足时循环:条件不满足时退出循环如果一开始条件就不满足,一次都不循环.如while false int sum = 0; int n = 1; wh ...
使用 keepalived 设置虚拟 IP 环境（转载）
使用 keepalived 设置虚拟 IP 环境原文地址:https://blog.csdn.net/kongxx/article/details/73173762 使用 keepalived 设置 ...
Android毛玻璃模糊化效果处理
三种方法第一种:比较简单,性能比较低 /** * 通过调用系统高斯模糊api的方法模糊 * * @param bitmap source bitmap * @par ...
windows server 2012 r2 安装IIS失败
给新的2012服务器安装IIS时报错: 错误原因:就在于选中了.net framework 3.5 . 如果要安装.net framework 3.5 使用以下步骤: 1 加载安装光盘,如果没有可以网 ...
ie-table不显示边框解决办法
.thisTd { background-clip: padding-box; position:relative; } 原来背景也有边界的:决定背景会盖住哪些部 ...
Entity Framework执行原生SQL语句
ExecuteSqlCommand为执行命令的接口, SqlQuery 为返回查询结果 1.Database.ExecuteSqlCommand 方法 (String, Object[]) 对数据库执 ...
Devlopment Env Setup install ubuntu16.04
http://blog.csdn.net/ljheee/article/details/52966048 1.add chinese language support settings -> i ...
三、html样式、链接、表格
MySQL/InnoDB中,对于锁的认识
MySQL/InnoDB的加锁,一直是一个面试中常问的话题.例如,数据库如果有高并发请求,如何保证数据完整性?产生死锁问题如何排查并解决?我在工作过程中,也会经常用到,乐观锁,排它锁,等.于是今天就对 ...
《机器学习实战》ID3算法实现
注释:之前从未接触过决策树,直接上手对着书看源码,有点难,确实有点难-- 本代码是基于ID3编写,之后的ID4.5和CART等还没学习到一.决策树的原理没有看网上原理,直接看源码懂得原理,下面是我 ...

Hbase数据读写流程

Hbase数据读写流程的更多相关文章

随机推荐

热门专题