HBase 学习之路(二)—— HBase系统架构及数据结构
一、基本概念
一个典型的Hbase Table 表如下:

1.1 Row Key (行键)
Row Key
是用来检索记录的主键。想要访问HBase Table中的数据,只有以下三种方式:
- 通过指定的
Row Key
进行访问; - 通过Row Key的range进行访问,即访问指定范围内的行;
- 进行全表扫描。
Row Key
可以是任意字符串,存储时数据按照Row Key
的字典序进行排序。这里需要注意以下两点:
- 因为字典序对Int排序的结果是1,10,100,11,12,13,14,15,16,17,18,19,2,20,21,…,9,91,92,93,94,95,96,97,98,99。如果你使用整型的字符串作为行键,那么为了保持整型的自然序,行键必须用0作左填充。
- 行的一次读写操作时原子性的 (不论一次读写多少列)。
1.2 Column Family(列族)
HBase表中的每个列,都归属于某个列族。列族是表的Schema的一部分,所以列族需要在创建表时进行定义。列族的所有列都以列族名作为前缀,例如courses:history
,courses:math
都属于courses
这个列族。
1.3 Column Qualifier (列限定符)
列限定符,你可以理解为是具体的列名,例如courses:history
,courses:math
都属于courses
这个列族,它们的列限定符分别是history
和math
。需要注意的是列限定符不是表Schema的一部分,你可以在插入数据的过程中动态创建列。
1.4 Column(列)
HBase中的列由列族和列限定符组成,它们由:
(冒号)进行分隔,即一个完整的列名应该表述为列族名 :列限定符
。
1.5 Cell
Cell
是行,列族和列限定符的组合,并包含值和时间戳。你可以等价理解为关系型数据库中由指定行和指定列确定的一个单元格,但不同的是HBase中的一个单元格是由多个版本的数据组成的,每个版本的数据用时间戳进行区分。
1.6 Timestamp(时间戳)
HBase 中通过row key
和column
确定的为一个存储单元称为Cell
。每个Cell
都保存着同一份数据的多个版本。版本通过时间戳来索引,时间戳的类型是 64位整型,时间戳可以由HBase在数据写入时自动赋值,也可以由客户显式指定。每个Cell
中,不同版本的数据按照时间戳倒序排列,即最新的数据排在最前面。
二、存储结构
2.1 Regions
HBase Table中的所有行按照Row Key
的字典序排列。HBase Tables 通过行键的范围(row key range)被水平切分成多个Region
, 一个Region
包含了在start key 和 end key之间的所有行。

每个表一开始只有一个Region
,随着数据不断增加,Region
会不断增大,当增大到一个阀值的时候,Region
就会等分为两个新的Region
。当Table中的行不断增多,就会有越来越多的Region
。

Region
是HBase中分布式存储和负载均衡的最小单元。这意味着不同的Region
可以分布在不同的Region Server
上。但一个Region
是不会拆分到多个Server上的。

2.2 Region Server
Region Server
运行在HDFS的DataNode上。它具有以下组件:
- WAL(Write Ahead Log,预写日志):用于存储尚未进持久化存储的数据记录,以便在发生故障时进行恢复。
- BlockCache:读缓存。它将频繁读取的数据存储在内存中,如果存储不足,它将按照
最近最少使用原则
清除多余的数据。 - MemStore:写缓存。它存储尚未写入磁盘的新数据,并会在数据写入磁盘之前对其进行排序。每个Region上的每个列族都有一个MemStore。
- HFile :将行数据按照Key\Values的形式存储在文件系统上。

Region Server存取一个子表时,会创建一个Region对象,然后对表的每个列族创建一个Store
实例,每个Store
会有 0 个或多个StoreFile
与之对应,每个StoreFile
则对应一个HFile
,HFile 就是实际存储在HDFS上的文件。

三、Hbase系统架构
3.1 系统架构
HBase系统遵循Master/Salve架构,由三种不同类型的组件组成:
Zookeeper
- 保证任何时候,集群中只有一个Master;
- 存贮所有Region的寻址入口;
- 实时监控Region Server的状态,将Region Server的上线和下线信息实时通知给Master;
- 存储HBase的Schema,包括有哪些Table,每个Table有哪些Column Family等信息。
Master
- 为Region Server分配Region ;
- 负责Region Server的负载均衡 ;
- 发现失效的Region Server并重新分配其上的Region;
- GFS上的垃圾文件回收;
- 处理Schema的更新请求。
Region Server
- Region Server负责维护Master分配给它的Region ,并处理发送到Region上的IO请求;
- Region Server负责切分在运行过程中变得过大的Region。

3.2 组件间的协作
HBase使用ZooKeeper作为分布式协调服务来维护集群中的服务器状态。 Zookeeper负责维护可用服务列表,并提供服务故障通知等服务:
- 每个Region Server都会在ZooKeeper上创建一个临时节点,Master通过Zookeeper的Watcher机制对节点进行监控,从而可以发现新加入的Region Server或故障退出的Region Server;
- 所有Masters会竞争性地在Zookeeper上创建同一个临时节点,由于Zookeeper只能有一个同名节点,所以必然只有一个Master能够创建成功,此时该Master就是主Master,主Master会定期向Zookeeper发送心跳。备用Masters则通过Watcher机制对主HMaster所在节点进行监听;
- 如果主Master未能定时发送心跳,则其持有的Zookeeper会话会过期,相应的临时节点也会被删除,这会触发定义在该节点上的Watcher事件,使得备用的Master Servers得到通知。所有备用的Master Servers在接到通知后,会再次去竞争性地创建临时节点,完成主Master的选举。

四、数据的读写流程简述
4.1 写入数据的流程
- Client向Region Server提交写请求;
- Region Server找到目标Region;
- Region检查数据是否与Schema一致;
- 如果客户端没有指定版本,则获取当前系统时间作为数据版本;
- 将更新写入WAL Log;
- 将更新写入Memstore;
- 判断Memstore存储是否已满,如果存储已满则需要flush为Store Hfile文件。
更为详细写入流程可以参考:HBase - 数据写入流程解析
4.2 读取数据的流程
以下是客户端首次读写HBase上数据的流程:
- 客户端从Zookeeper获取
META
表所在的Region Server; - 客户端访问
META
表所在的Region Server,从META
表中查询到访问行键所在的Region Server,之后客户端将缓存这些信息以及META
表的位置; - 客户端从行键所在的Region Server上获取数据。
如果再次读取,客户端将从缓存中获取行键所在的Region Server。这样客户端就不需要再次查询META
表,除非Region移动导致缓存失效,这样的话,则将会重新查询并更新缓存。
注:META
表是HBase中一张特殊的表,它保存了所有Region的位置信息,META表自己的位置信息则存储在ZooKeeper上。

更为详细读取数据流程参考:
参考资料
本篇文章内容主要参考自官方文档和以下两篇博客,图片也主要引用自以下两篇博客:
官方文档:
更多大数据系列文章可以参见个人 GitHub 开源项目: 程序员大数据入门指南
HBase 学习之路(二)—— HBase系统架构及数据结构的更多相关文章
- Windows Internals学习笔记(二)系统架构
参考资料: 1. <Windows Internals> 2. http://bestcbooks.com 3. Windows Drive Kit 4. Microsoft Window ...
- HBase 系列(二)—— HBase 系统架构及数据结构
一.基本概念 一个典型的 Hbase Table 表如下: 1.1 Row Key (行键) Row Key 是用来检索记录的主键.想要访问 HBase Table 中的数据,只有以下三种方式: 通过 ...
- HBase系统架构及数据结构(转)
原文链接:Hbase系统架构及数据结构 HBase中的表一般有这样的特点: 1 大:一个表可以有上亿行,上百万列 2 面向列:面向列(族)的存储和权限控制,列(族)独立检索. 3 稀疏:对于为空(nu ...
- HBase 系统架构及数据结构
一.基本概念 2.1 Row Key (行键) 2.2 Column Family(列族) 2.3 Column Qualifier (列限定符) 2.4 Column ...
- HBase学习之路 (二)HBase集群安装
前提 1.HBase 依赖于 HDFS 做底层的数据存储 2.HBase 依赖于 MapReduce 做数据计算 3.HBase 依赖于 ZooKeeper 做服务协调 4.HBase源码是java编 ...
- hbase 学习(十六)系统架构图
HBase 系统架构图 组成部件说明 Client: 使用HBase RPC机制与HMaster和HRegionServer进行通信 Client与HMaster进行通信进行管理类操作 Client与 ...
- HBase学习之路 (七)HBase 原理
系统架构 错误图解 这张图是有一个错误点:应该是每一个 RegionServer 就只有一个 HLog,而不是一个 Region 有一个 HLog. 正确图解 从HBase的架构图上可以看出,HBas ...
- HBase 学习之路(八)——HBase协处理器
一.简述 在使用HBase时,如果你的数据量达到了数十亿行或数百万列,此时能否在查询中返回大量数据将受制于网络的带宽,即便网络状况允许,但是客户端的计算处理也未必能够满足要求.在这种情况下,协处理器( ...
- 大数据学习之路之HBASE
Hadoop之HBASE 一.HBASE简介 HBase是一个开源的.分布式的,多版本的,面向列的,半结构化的NoSql数据库,提供高性能的随机读写结构化数据的能力.它可以直接使用本地文件系统,也可以 ...
随机推荐
- 正确 C#
未来的期望
接触 C# 一年.整体上是一个很完好的语言,可是某些细节特征还是不够完美.这里记下我如今对它将来的一些期望. 更强大的泛型约束 与 C++ 的模板相似,C# 的泛型使得编写适用于多种类型的代码更加简洁 ...
- Scatter matrix(散布矩阵)
n 个 m 维的样本,Xm×n=[x1,x2,-,xn],样本均值定义为: x¯=1n∑i=1nxi 散列矩阵定义为如下的半正定矩阵: S=∑j=1n(xj−x¯)(xj−x¯)T=∑j=1n(xj− ...
- NPM镜像设置方法!
使用npm安装一些包失败了的看过来(npm国内镜像介绍) 发布于 2012-4-26 04:19 最后一次编辑是 2013-12-11 23:21 这个也是网上搜的,亲自试过,非常好用! 镜像使用方法 ...
- SICP 1.29-1.33
1.29 (define (sum term a next b) (if (> a b) (+ (term a) (sum term (next a) next b)))) (define (c ...
- jquery ready和window onload区别
window onload是指标签加载完成,并且标签资源加载完成: jquery ready是指标签加载完成,标签资源可能未加载完成 $(document).ready(function(){});= ...
- .NET VS 自定义新建代码文件模板
参考:http://www.cnblogs.com/fightingtong/p/3765914.html 在VS中新建文件时,可使用模板在文件中生成指定内容.只需要把IDE安装目录下的模板进行修改保 ...
- 生成view的描述字段列表
); declare @field_list nvarchar(max); set @table = N'vwMaterial'; set @field_list = N''; SELECT u.na ...
- missing equal sign
"UPDATE TB_BOOKINGSET REC_LOC_CODE = ?,CUSTOMER_ADDR?WHERE BOOKING_NO=? AND TRANSPORT_MODE=? &q ...
- The specified type member 'IsLock' is not supported in LINQ to Entities. Only initializers, entity members, and entity navigation properties are supported.
var query = from C in objDb.GetDb<A>() join a in objDb.GetDb<B>().Where(m => m.Comput ...
- 如果您想确保Windows 10在新用户登录时不安装内置应用程序,则必须删除所有配置的应用程序。
原文 如果您想确保Windows 10在新用户登录时不安装内置应用程序,则必须删除所有配置的应用程序. 本文的内容 已安装与配置的应用程序 删除配置的应用程序 安装与配置的应用程序^ 在介绍如何删除所 ...