Hbase 学习笔记2----概念

说在前面,本文部分内容来源于社区官网经过适度翻译，部分根据经验总结，部分是抄袭网络博文，(不一一列举引用，在此致歉)一并列在一起，本文的目的，希望能总结出一些有用的，应该注意到的东西，基本思路是先提出一个话题，在此话题内，把相关联的东西加进去，而不是单独分出章节单独介绍，虽然条理性欠差，但有利于后期根据关键词查找。

HBase 基本概念

1、region

region 是部分数据，所以是所有数据的一个自己，但region包括完整的行，所以region 是行为单位表的一个子集。每个region 有三个主要要素:

（1）它所属于哪张表

（2）它所包含的的第一行(第一个region 没有首行)

（3）他所包含的最后一行(末一个region 没有末行)

当表初写数据时，此时表只有一个region ,当随着数据的增多，region 开始变大，等到它达到限定的阀值大小时，变化把region 分裂为两个大小基本相同的region,而这个阀值就是storefile 的设定大小(参数:hbase.hregion.max.filesize 新版本默认10G) ,在第一次分裂region之前，所有加载的数据都放在原始区域的那台服务器上，随着表的变大region 的个数也会相应的增加，而region 是Hbase集群分布数据的最小单位。(但region 也是由block组成，具体这个block和hdfs block什么样的关系后面再说，region是属于单一的regionserver，除非这个regionserver 宕机，或者其它方式挂掉，再或者执行balance时，才可能会将这部分region的信息转移到其它机器上。)

这也就是为什么region比较少的时候，导致region分配不均，总是分派到少数的节点上，读写并发效果不显著，这就是hbase 读写效率比较低的原因。

2、加锁

HBase的锁是行锁，无论对行进行访问的事物有多少列，那对此行的更新都会是原子操作，要么成功，要么失败，不会存在部分成功的情况。这就说明，如果只更新一个行1000个列中的一个列，那也会对正行加锁。

3、Hbase元数据表

HBase内部维护着两个元数据表，分别是-ROOT- 和 .META. 表他们分别维护者当前集群所有region 的列表、状态和位置。-ROOT-表包含.META.表的region 列表，因为.META.表可能会因为超过region的大小而进行分裂，所以-ROOT-才会保存.META.表的region索引，-ROOT-表是不会分裂的。而.META. 表中则包含所有用户region（user-space region）的列表。表中的项使用region 名作为键。region名由所属的表名、region的起始行、创建的时间以及对其整体进行MD5 hash值。

比如:

award_week_2013,201311:170100626,1371697714559.f7f37b98c01f68b7b5cc6c1c3734a666

|--表名-------------|-----起始行---------|--创建时间戳---|----整体进行MD5 hash 值------------|

由此我们联想到表scan 的过程中如果加了 STARTROW 和 ENDROW 的属性后，查找是很迅速的，就是因为根据给定rowkey从.META.表中找到所在的region,然后再从region去查找。

这个表的值什么时候会变化？

当region 进行split、disable、enable、drop或者 balance 导致region重新分配或者由于regionserver 挂掉而导致重新分配region时，.META.表的数据会进行及时的更新，

这样才能保证根据meta访问到的表是存在的。

4、访问流程

客户端client 首先连接到ZooKeeper 这是就要先查找-ROOT-的位置。
然后client通过-ROOT- 获取所请求行所在范围所属的.META.region的位置。
client接着查找.META.region来获取user-space region 所在的节点和位置。
接着client 就可以直接和管理者那个region的RegionServer 进行交互。

注：

每个行操作可能要访问三次远程节点，为了节省这些代价，client会缓存他们遍历-ROOT-和.META. 的位置以及user-space region的开始行和结束行，这样每次访问就不会再从表中去查询了，但如果变动了怎么办？却是存在这个问题，这样的话client 会出现错误，那此时region毫无疑问是移动了，这时，client 会再次从.META.查找region 的

新位置并再次将其放入到缓存中去，周而复始。同样道理如果.META.的region移动了，client 也才会去-ROOT-表查询.META.region的新位置。

不过由于hbase 设计的问题，所以在MapReduce过程中如果用到hbase时，访问缓存中的region就会出现错误，出现错误后，缓存更新，task再次尝试就能正确通过

下面是我们常遇到的bug：

2013-09-24 01:26:15,487 ERROR org.apache.hadoop.hbase.regionserver.HRegionServer:

Closing scanner for tmp_toplist_gold_total_1001,,1379956828778.4a8e5f51eafc48aed247913c715a8cc1.

org.apache.hadoop.hbase.NotServingRegionException: Region is not online: tmp_toplist_gold_total_1001,,1379956828778.4a8e5f51eafc48aed247913c715a8cc1.

基于这种情况会时常发生，建议不要让task 尝试的次数改为1，这样会导致很多job fail

这两个参数分别是：

mapred.reduce.max.attempts reduce 任务最大尝试次数默认是4

5、Zookeeper的作用

Zookeeper简单说就是协调和服务于分布式应用程序的服务。

Zookeeper Quorum 中除了存储-ROOT-表的地址和Hmaster 的地址，HRegionServer 也以Ephemeral的方式注册到Zookeeper中，这样Hmaster 就可以随时感知到各个

RegionServer的健康状况，还有就是Zookeeper通过Election的方式避免了Hmaster的单点问题。

存贮所有Region的寻址入口。
存储Hbase的schema,包括有哪些table，每个table有哪些column family

6、Hmaster

上面说了，Zookeeper避免了HMaster的单点问题，一个Hbase集群可以启动多个HMaster，而Zookeeper通过Election的方式保证集群中只有一个HMaster处于live的状态

其它都处于休眠的状态，如果HMaster出现问题，则Zookeeper 则唤醒其它休眠的HMaster。

HMaster 在功能上主要负责哪些工作呢？

1、管理用户对Table的增、删、改、查操作

2、管理RegionServer的负载均衡、调整Region的分布

3、在Region Split后，将新Region分布到不同的RegionServer。

4、在RegionServer宕机后，那该RegionServer上所管理的Region 由HMaster进行重新分配。

总结HMaster 的主要任务：1、HTable DDL 操作 2、Region 分配工作。其余的基本上都是client 和RegionServer打交道来完成的。

7、HRegionServer

HRegionServer 主要负责相应用户的I/O请求，进而跟HDFS交互，从HDFS中读写数据，虽然每个进程都很重要，但个人认为HRegionServer是HBase中最核心的进程。

下面对HRegionServer的内部结构做一个简单描述:

HRegionServer 内部管理了一系列的HRegion对象，HRegion和Region是一回事吗？其实HRegion对应了Table中的一个Region，HRegion是对其进行的封装。每个HRegion中由多个HStore组成。

HStore则对应Table中的Column Family，不论此Column Family 内部有多少数据，都会创建一个新的HStore,因此将相同属性的数据放进相同的Column Family 很有必要，避免一次访问，访问多个HStore，性能低下。而HStore 则是HBase的核心的存储单元了，而HStore 由两个部分组成，一时MemStore,再就是StoreFile

MemStore 是Sorted Memory Buffer ,client 写入的数据先写入MemStore,当达到MemStore的阀值时，将其Flush 成为一个StoreFile(HFile),StoreFile 则是存储在硬盘上的文件，具体这个阀值时多少？

hbase.hregion.memstore.flush.size 这个参数表示每个MemStore的大小，当然系统默认是134217728 bytes 也就是128M，这个参数需考虑每个RS负担的Region个数。消费模式来异步处理的。那这里就有一个问题，当队列来不及消费，产生大量积压请求时，可能会导致内存陡增，最坏的情况是触发OOM。

上面说到，当该Region下所有的MemStore 之和超过指定值时，就触发flush，而前面又说了在一个Region下每个Column Family 一个HStore ,那多个Column Family 这样问题出来了，如果一个HStore数据量大，而另外一个HStore 仅有几条数据，会同时 flush吗? 对，这就说明了一个问题，在Hbase表设计的时候尽量设置单一ColumnFamily的

表，否则Hbase不能很好的处理上面类似的问题。

除了上面的参数还有两个参数放MemStore占用的内存

这个参数表示，当该RegionServer 下所有的MemStore达到总Heap 内存的35%时，触发flush个别占用内存大的MemStore,这是会做block，写更新还是会收影响。

8、HBase数据存储

1、HBase中所有的数据都是存放在Hadoop HDFS文件系统上，而这部分文件包括两种文件类型：

一是HFile Hadoop的二进制文件，实际上是StoreFile对HFile 做了一个轻量级包装，所以StoreFile 的底层就是Hfile。

二是HLog File 也就是HBase的WAL (Write Ahead Log)，实际上在hadoop内部以Sequence File 的形式存在。什么是Sequence File 会在后面的Hadop章节中做介绍,现在了解它

下面是HFile 的存储格式，也是官方的一个图。

再把第二张图贴出来：

结合上面两张图看，更加直观，第一张图是HFile 文件的格式，下面图是其中Data Block 中KeyValue的详细结构，如果第一张图相当于分子的话，那第二张就是原子，最小的不可再分的。

看第一张:HFile文件是不定长的，订场的只有其中两块 FileInfo 和 Trailer 分别存储文件的Meta信息，比如AVG_KEY_LEN,LAST_KEY,COMPARATOR,MAX_SEQ_ID_KEY等信息,Data Index 和 Meta Index 分别记载了每个Data块和Meta块的起始点。Data Block 是 HBase I/O的基本单元，这看到了 Region 最后也是到了Block，不过这个Block是可以手动设置的。

比如:create 'newtable',{NAME=>'info',BLOCKSIZE=>'131072'},我就是将Family info 的BlockSize 设置为132072 就是是128M 默认是65536 也就是64M刚好和hadoop的hdfs block 也就是dfs.block.size 默认也是64M 是一样的?对吗?错误，Hbase 列族Data Block size 是 65536字节也就是64k 是hdfs block size的 1/1024,这地方和Hdfs是一个区别，采用这么细粒度，目的在块操作时更有效的加载和缓存数据，它不依赖于HDFS 块的尺寸设计，而仅仅属于hbase内部的一个属性，而HDFS把块设计成64M是方便MapReduce时使用.

下面再把Data 打开看看它内部有些什么东西，Magic 和繁多的KeyValue.

HLog File 机构不做详细的说明了，是SequenceFile 文件，仅做一下HLogFile是如果工作的介绍一下:

Client 想Hbase 写数据的时候，会同时写MemStore 和 HLog ,当间隔一定的时间，MemStore 永久存储到硬盘中了，也就是由MemStore flush成storeFile 了，那这部分Hlog就会删除

但是，当MemStore还没写到硬盘中时，RegionServer 突然挂了怎么办?那这时HMaster 该粉墨登场了，它会将Hlog 根据分配到不同的region中，并将挂了的RegionServer 下的Region重新分配到新的RegionServer,当RegionServer Load Region的时候，发现有为处理的HLog，那就通过Replay log的方式写入到MemStore 中，完成数据恢复。

Hbase 学习笔记2----概念的更多相关文章

Oracle RAC学习笔记:基本概念及入门
Oracle RAC学习笔记:基本概念及入门 2010年04月19日 10:39 来源:书童的博客作者:书童编辑:晓熊 [技术开发技术文章] oracle 10g real applica ...
Java IO学习笔记：概念与原理
Java IO学习笔记:概念与原理一.概念 Java中对文件的操作是以流的方式进行的.流是Java内存中的一组有序数据序列.Java将数据从源(文件.内存.键盘.网络)读入到内存中,形成了 ...
jQuery学习笔记之概念（1）
jQuery学习笔记之概念(1) ----------------------学习目录-------------------- 1.概念 2.特点 3.选择器 4.DOM操作 5.事件 6.jQuer ...
HBase学习笔记之HBase的安装和配置
HBase学习笔记之HBase的安装和配置我是为了调研和验证hbase的bulkload功能,才安装hbase,学习hbase的.为了快速的验证bulkload功能,我安装了一个节点的hadoop集 ...
HBASE学习笔记(四)
这两天把要前几天的知识点回顾一下,接下来我会用自己对知识点的理解来写一些东西一.知识点回顾 1.hbase集群启动:$>start-hbase.sh ===>hbase-daemon.s ...
HBase学习笔记（四）—— 架构模型
在逻辑上,HBase 的数据模型同关系型数据库很类似,数据存储在一张表中,有行有列. 但从 HBase 的底层物理存储结构(K-V)来看,HBase 更像是一个 multi-dimensional m ...
tensorflow学习笔记——常见概念的整理
TensorFlow的名字中已经说明了它最重要的两个概念——Tensor和Flow.Tensor就是张量,张量这个概念在数学或者物理学中可以有不同的解释,但是这里我们不强调它本身的含义.在Tensor ...
AngularJs学习笔记--concepts(概念)
原版地址:http://code.angularjs.org/1.0.2/docs/guide/concepts 继续.. 一.总括本文主要是angular组件(components)的概览,并说明 ...
HBase学习笔记之BulkLoad
HBase学习之BulkLoad bulkload的学习以后再写文章. 参考资料: 1.https://blog.csdn.net/shixiaoguo90/article/details/78038 ...
HBase学习笔记之HBase原理和Shell使用
HBase学习指南之HBase原理和Shell使用参考资料: 1.https://www.cnblogs.com/nexiyi/p/hbase_shell.html,hbase shell

随机推荐

CSDN日报20170217——《辞职信：写给我的“藤野先生”》
[程序人生] 辞职信:写给我的"藤野先生" 作者:马伟青对于离职的事情,我想由衷的对你说声抱歉! 我不是一个不懂得感恩的人,也不是一个不忠诚的人,更不是一个不热爱工作的人.不管提 ...
Softmatic ScreenLayers 将截图存为psd格式
Softmatic ScreenLayers 是 Mac 上的一款截图软件,它与众不同的地方是可以将截取的屏幕图片按PSD格式保存到本地,并且图片里的每一种元素都被单独放入一个独立的layer,比如M ...
spark(1.1) mllib 源码分析(三)-朴素贝叶斯
原创文章,转载请注明: 转载自http://www.cnblogs.com/tovin/p/4042467.html 本文主要以mllib 1.1版本为基础,分析朴素贝叶斯的基本原理与源码一.基本原 ...
将MathType公式粘贴到文档中的步骤
MathType这款数学公式编辑器,常常是辅助于各种文档使用的.由于其编辑的公式与数学符号等都符号国际期刊的出版标准,并且上手容易,根本就不需要一个学习的过程,只要安装打开后就能直接上手使用.所以非常 ...
Android开发：《Gradle Recipes for Android》阅读笔记(翻译)6.1——推荐配置
问题: 你想要提高Gradle的构建效率. 解决方案: 使用下面推荐的技术组合. 讨论: 首先,这里没有可以影响app表现的建议.有很多你可以做的事来提高app,很多都和Android的混淆工具有关. ...
简易新闻网站NewsWeb-网页抓取
本文转载自姚虎才子今天做项目时用到java抓取网页内容,本以为很简单的一件事但是还是让我蛋疼了一会,网上资料一大堆但是都是通过url抓取网页内容,但是我要的是读取本地的html页面内容的方法,网上找 ...
JStorm开发经验+运维经验总结
1.开发经验总结 ——12 Sep 2014 · 8 revisions 在jstorm中, spout中nextTuple和ack/fail运行在不同的线程中, 从而鼓励用户在nextTuple里 ...
爬虫实战【9】Selenium解析淘宝宝贝-获取宝贝信息并保存
通过昨天的分析,我们已经能到依次打开多个页面了,接下来就是获取每个页面上宝贝的信息了. 分析页面宝贝信息 [插入图片,宝贝信息各项内容] 从图片上看,每个宝贝有如下信息:price,title,url ...
原生js：js获得当前选中的内容的字体大小
利用currentStyle()和ComputedStyle() function getstyle(obj, key) { if (obj.currentStyle) { ret ...
PAT 甲级 1003Emergency(Dijkstra最短路)
1003. Emergency (25) 时间限制 400 ms 内存限制 65536 kB 代码长度限制 16000 B 判题程序 Standard 作者 CHEN, Yue As an emerg ...

Hbase 学习笔记2----概念

Hbase 学习笔记2----概念的更多相关文章

随机推荐

热门专题