第一：hbase介绍

hbase是一个构建在hdfs上的分布式列存储系统；

hbase是apache hadoop生态系统中的重要一员，主要用于海量结构化数据存储

从逻辑上讲，hbase将数据按照表、行和列进行存储

hbase表特点：

　　1.大：一个表可以有数十亿行，上百万列；

　　2.无模式：每行都有一个可排序的主键和任意多的列，列可以根据需要动态的增加，同一张表中不同的行可以有截然不同的列；

　　3.面向列：面向列（族）的存储和权限控制，列（族）独立检索；

　　4.稀疏：对于空（null）的列，并不占用存储空间，表可以设计的非常稀疏；

　　5.数据多版本：每个单元中的数据可以有多个版本，默认情况下版本号自动分配，是单元格插入时的时间戳；

　　6.数据类型单一：hbase中的数据都是字符串，没有类型

hbase与hdfs的对比：

　　1.两者都具有良好的容错性和扩展性，都可以扩展到成百上千个节点。

　　2.hdfs适合批处理场景,不支持数据随机查找，不适合增量数据处理，不支持数据更新。

行存储与列存储：

　　传统行式数据库：

　　　　1.数据是按行存储的

　　　　2.没有索引的查询使用大量I/O

　　　　3.建立索引和物化视图需要花费大量时间和资源

　　　　4.面向查询的需求，数据库必须被大量膨胀才能满足性能要求

　　列式数据库:

　　　　1.数据是按列存储-每一列单独存放

　　　　2.数据即是索引

　　　　3.指访问查询涉及的列-大量降低系统I/O

　　　　4.每一列由一个线索来处理-查询的并发处理

　　　　5.数据类型一致，数据特征相似-高效压缩

第二：hbase数据模型

hbase是基于Google BigTable模型开发的，典型的key/value系统

hbase数据模型术语：

Table（表）

一个hbase包含多个行，是在schema声明的时候定义的

Row（行）

行键是不可分割的字节数组。行是按字典排序由低到高存储在表中的。一个空的数组是用来标识表空间的起始或者结尾。

Row Key

　　1）Byte array

　　2）表中每条记录的“主键”

　　3）方便快速查找

Column Family

　　1）拥有一个名称（string）

　　2）包含一个或者多个相关的列，是一些列的集合

　　3）一个列簇所有列成员具有相同的前缀

Column

　　1）属于某一个column family

　　2）包含在某一列中

Cell（value）

　　1）A {row, column, version} 元组就是一个HBase中的一个 cell。

　　2）Cell的内容是不可分割的字节数组。

　　3）可以为空

Timestamp（时间戳）

version number（版本号）

　　1）每个rowkey唯一

　　2）默认值-----》系统时间戳

　　3）类型为Long

　　4）无需递增插入

数据模型操作

1. 所有操作均是基于rowkey的；

2. 支持CRUD（Create、Read、Update和Delete）和 Scan；

3. 单行操作 Put Get Scan

　多行操作 Scan MultiPut

4. 没有内置join操作，可使用MapReduce解决

第三：hbase物理模型

每个column family存储在HDFS上的一个单独文件中；

Key和Version number在每个column family中均有一份

空值不被保存

eg:

info Column Family:

roles Column Family

数据物理存储：

1.Table中所有的行都按照row key的字典序列排列；

2.Table在行的方向上被分割为多个Region；

3.Region按照大小分割的，每个表开始只有一个region，随着数据的增多，region不断的增大，当增大到一个阀值的时候，region就会等分成两个新的region，之后会有越来越多的region；

4.Region是Hbase中分布式存储和负载均衡的最小单元，不同的region分布在不同RegionServer上；

5.Region虽然是分布式存储的最小单元，但并不是存储的最小单元。

　　1）Region是由一个或者多个Store组成，每个store保存一个columns family；

　　2）每个Store又由一个memStore和0或多个StoreFile组成

　　3）memStore存储在内存中，StoreFile存储在HDFS上。

第四：hbase基础架构

Hbase架构：

在分布式的生产环境中，HBase 需要运行在 HDFS 之上，以 HDFS 作为其基础的存储设施。在 HBase 的集群中主要由 Master 和 Region Server 组成，以及 Zookeeper

Hbase相关的组件：

Clinet：

　　包含访问Hbase的接口，并维护cache来加快对Hbase的访问。

zookeeper:

　　保证任何时候，集群中只有一个master

　　存储所有Region的寻址入口

　　实时监控Region Server的上线或者下线信息，并实时通知给Master

　　存储HBase的schema和table元数据

　　zookeeper作用：

　　　　HBase依赖zk；

　　　　默认情况下Hbase管理zk实例，eg：启动或者停止zk

　　　　Master与RegionServers启动时会向zk注册

　　　　Zookeeper的引入使得Master不在是单点故障

Master:

　　为Region Server分配region

　　负责Region Server的负载均衡

　　发现失效的Region Server并重新分配他上面的region

　　管理用户对table的增删改查操作

Region Server:

　　维护region，处理对这些region的IO请求

　　负责切分在运行过程中变得过大的region

-ROOT-表与-META-表：

-ROOT-表：

　　包含-META-表所在的region列表，该表只会有一个Region；

　　zookeeper中记录了-ROOT-表的位置

-META-表：

　　包含所有的用户空间region列表，以及RegionServer的服务器地址

详解：

1.HBase的所有Region元数据被存储在.META.表中，随着Region的增多，.META.表中的数据也会增大，并分裂成多个新的Region。为了定位.META.表中各个Region的位置，把.META.表中所有Region的元数据保存在-ROOT-表中，最后由Zookeeper记录-ROOT-表的位置信息。所有客户端访问用户数据前，需要首先访问Zookeeper获得-ROOT-的位置，然后访问-ROOT-表获得.META.表的位置，最后根据.META.表中的信息确定用户数据存放的位置，如上图所示。

2.-ROOT-表永远不会被分割，它只有一个Region，这样可以保证最多只需要三次跳转就可以定位任意一个Region。为了加快访问速度，.META.表的所有Region全部保存在内存中。客户端会将查询过的位置信息缓存起来，且缓存不会主动失效。如果客户端根据缓存信息还访问不到数据，则询问相关.META.表的Region服务器，试图获取数据的位置，如果还是失败，则询问-ROOT-表相关的.META.表在哪里。最后，如果前面的信息全部失效，则通过ZooKeeper重新定位Region的信息。所以如果客户端上的缓存全部是失效，则需要进行6次网络来回，才能定位到正确的Region。

高可用

Write-Ahead-Log（WAL）保障数据高可用

理解高可用首先：必须理解下HLog的作用，HBase中的Hlog机制是WAL的一种实现，而WAL是事务机制中常见的一致性的实现方式。每个RegionServer中都会有一个HLog的实例，RegionServer会将更新操作（put，delete等），先记录到WAL（也就是HLog中），然后再将其写入到Store的MemStore，最终Memstore达到一定的阀值后，在写入到HFile中，这样就保证了HBase的写的可靠性，若没有WAL，当RegionServer挂掉的时候，MemStore还没有写到HFile的数据，或者说StoreFile没有保存的时候，数据会丢失。（说到这里或许有人会问，假如HFile本身丢失了怎么办，这是由HDFS来保证的。在HDFS中的数据默认会有3份）

HFile是由很多个数据块（Block）组成，并且有一个固定的结尾块，其中的数据块是由一个Header和多个Key-Value的键值对组成，在结尾的数据块中包含了数据相关的索引信息，系统也是通过结尾的索引信息找到HFile中的数据。

上图是RegionServer数据存储关系图。上文提到，HBase使用MemStore和StoreFile存储对表的更新。数据在更新时首先写入HLog和MemStore。MemStore中的数据是排序的，当MemStore累计到一定阈值时，就会创建一个新的MemStore，并且将老的MemStore添加到Flush队列，由单独的线程Flush到磁盘上，成为一个StoreFile。与此同时，系统会在Zookeeper中记录一个CheckPoint，表示这个时刻之前的数据变更已经持久化了。当系统出现意外时，可能导致MemStore中的数据丢失，此时使用HLog来恢复CheckPoint之后的数据。

StoreFile是只读的，一旦创建后就不可以再修改。因此Hbase的更新其实是不断追加的操作。当一个Store中的StoreFile达到一定阈值后，就会进行一次合并操作,将对同一个key的修改合并到一起，形成一个大的StoreFile。当StoreFile的大小达到一定阈值后，又会对 StoreFile进行切分操作，等分为两个StoreFile。

详解

组件的高可用

Master容错：Zookeeper重新选择一个新的Master

　　无Master过程中，数据读取任然照常进行

　　无Master过程中，region切分、负载均衡等无法进行

RegionServer容错：

　　定时向Zookeeper汇报心跳，如果一旦一段时间内未出现心跳，Master将该RegionServer上的Region重新分配到其他的RegionServer上；

　　失效的服务器上“预写”日志由主服务器进行分割并派送给新的RegionServer上

zookeeper容错：zookeeper是一个可靠的服务

　　一般是3到5个zookeeper实例

读写流程

　　写操作：

　　　　1）client通过zookeeper的调度，向regionserver发出写数据的请求，在Region中写数据

　　　　2）数据首先记录在HLog中，然后再将其写入到Store的MemStore，直到MemStore达到预定阀值

　　　　3）MemStore中的数据被Flush成一个StoreFile

　　　　4）随着StoreFile文件的不断增多，当其数据增长到一定阀值后，触发Compact合并操作，将多个StoreFile合并成一个StoreFile，同时进行版本合并和数据删除

　　　　5）StoreFiles通过不断的Compact合并操作，逐步形成越来越大的StoreFile

　　　　6）单个StoreFile大小超过一定阀值后，触发Split操作，把当前Region Split成2个新的Region，父Region会下线，新Split出的2个子Region会被HMaster分配到相应的RegionServer上，使原先1个Region的压力得以分流到2个Region上面

　　通过上述的写流程可以发现，HBase更新、删除等操作都是在后续Compact历程中进行的，使得用户的写操作只要进入内存就可以立刻返回，实现可HBase I/0的高性能。

　　读操作：

　　　　1）client访问zk，查找-ROOT-表，获取.META.表的信息。

　　　　2）从.META.表查找，获取存放目标数据的Region信息，从而找到对应的RegionServer。

　　　　3）通过RegionServer获取需要查找的数据

　　　　4）RegionServer的内存分为MemStore和BlockCache两部分，MemStore主要用于写数据，BlockCache主要用于读数据，读请求先到MemStore中查数据，查不到就到BlockCache中查，在查不到就会到StoreFile上读，并把读的结果放入BlockCache中。

　　读取流程：client-->zookeeper-->-ROOT-表-->.META.表-->RegionServer-->Region-->client

hbase数据原理及基本架构的更多相关文章

【HBase】二、HBase实现原理及系统架构
整个Hadoop生态中大量使用了master-slave的主从式架构,如同HDFS中的namenode和datanode,MapReduce中的JobTracker和TaskTracker,YAR ...
Atitit. 数据约束校验原理理论与架构设计理念模式java php c#.net js javascript mysql oracle
Atitit. 数据约束校验原理理论与架构设计理念模式java php c#.net js javascript mysql oracle 1. 主键1 2. uniq index2 3. ...
Hbase：原理和设计
转载自:http://www.sysdb.cn/index.php/2016/01/10/hbase_principle/ ,感谢原作者. 简介 HBase —— Hadoop Database的简称 ...
Hadoop 综合揭秘——HBase的原理与应用
前言现今互联网科技发展日新月异,大数据.云计算.人工智能等技术已经成为前瞻性产品,海量数据和超高并发让传统的 Web2.0 网站有点力不从心,暴露了很多难以克服的问题.为此,Google.Amazo ...
Hbase概念原理扫盲
一.Hbase简介 1.什么是Hbase Hbase的原型是google的BigTable论文,收到了该论文思想的启发,目前作为hadoop的子项目来开发维护,用于支持结构化的数据存储. Hbase是 ...
HBase 底层原理详解（深度好文，建议收藏）
HBase简介 HBase 是一个分布式的.面向列的开源数据库.建立在 HDFS 之上.Hbase的名字的来源是 Hadoop database,即 Hadoop 数据库.HBase 的计算和存储能力 ...
（转）HBase 的原理和设计
转自:HBase的原理和设计 HBase架构:
MySQL运行原理与基础架构
1.MySQL基础 MySQL是一个开放源代码的关系数据库管理系统.原开发者为瑞典的MySQL AB公司,最早是在2001年MySQL3.23进入到管理员的视野并在之后获得广泛的应用. 2008年My ...
HBase 学习之一 <<HBase使用客户端API动态创建Hbase数据表并在Hbase下导出执行>>
HBase使用客户端API动态创建Hbase数据表并在Hbase下导出执行 ----首先感谢网络能够给我提供一个开放的学习平台,如果没有网上的技术爱好者提供 ...

随机推荐

Elastichsearch实践——基本使用
官网文档:https://www.elastic.co/guide/cn/elasticsearch/guide/current/getting-started.html es中的索引.类型.文档可以 ...
Java基础——Instanceof 运算符
Instanceof 运算符 java 中的instanceof 运算符是用来在运行时指出对象是否为特定类的一个实例 instanceof运算返回值:boolean类型用法 boolean resu ...
处理 oracle 数据库导入报错“IMP-00058: 遇到 ORACLE 错误 942”
在导入数据文件的时候出现了下图错误: 经过多次百度搜索问题.得知问题错误方向: 仔细的查询了被导入数据的数据库的版本: 而被导入的数据包 dmp 文件是从 oracle11g r2的版本导出的. 所 ...
gardner 算法matlab实现
% 仿真4比特原始数据与星座图的编码映射过程: % 完成16QAM信号的调制解调: % 基带信号符号速率 ps ＝1Mbps: % 成形滤波器的滚降因子 a=0.8: % 载波信号频率fc=2MHz ...
C语言感想---第一次作业
初入C语言的学习,因为所学薄浅,对于其逻辑的理解还是没有太大问题.唯一的不足是在操作上对全新的字符串式的代码很不熟悉,往往会导致个别字符的遗漏,而这些很细致的东西自己又很难被发现,所以只能慢慢熟练,多 ...
学习日志1 :java 三大框架了解
1.spring--------利用它的IOC和AOP来处理控制业务(负责对数据库的操作) https://blog.csdn.net/yu616568/article/details/7073997 ...
Zabbix （四）用户管理
本文章主要介绍zabbix用户管理,包括用户增删改查.用户报警媒介管理.用户权限管理安装完zabbix后,系统会自带两个用户,分别为:Admin和Guests 一.超级管理员 zabbix安装完成后 ...
.net core 部署在iis上
1. 启用iis (过程略) 参考操作流程 2. 下载并安装 .NET Core Windows Server Hosting 下载链接下载完成后安装 3. 启动 windows process a ...
linux常用命令及使用技巧(三)
文件管理与编辑 mkdir创建一个目录 mkdir [选项] 目录名 -m 设置存取权限 -p 可以一次创建多个目录 more命令读取文本文件,灭次显示一屏,并在每屏后暂停 cat命令将文件的内容输出 ...
C# 知识点回忆..
方便查阅: 数据结构与算法 1.线性表: (1)数据结构2 - 线性表 (2)数据结构和算法 c#– 1.单项链表委托和事件委托1:C#4.0图解教程 - 第15章委托委托2:<C#本质 ...

hbase数据原理及基本架构

第一：hbase介绍

hbase表特点：

hbase与hdfs的对比：

行存储与列存储：

第二：hbase数据模型

hbase数据模型术语：

数据模型操作

第三：hbase物理模型

数据物理存储：

第四：hbase基础架构

Hbase相关的组件：

-ROOT-表与-META-表：

高可用

Write-Ahead-Log（WAL）保障数据高可用

组件的高可用

读写流程

写操作：

读操作：

hbase数据原理及基本架构的更多相关文章

随机推荐

热门专题

　　写操作：

　　读操作：