Hbase优化总结

1.JVM参数优化:

–Xmn=12G –Xms=24G -Xmx=24G 根据实际机器情况调整，一般为整个机器内存的一半，同时建议regionServer的堆内存建议不要超过32G ;
-XX:PermSize=512M -XX:MaxPermSize=512M;
-XX:+UseConcMarkSweepGC -XX:+UseParNewGC (建议使用CMS垃圾收集器, 其它JVM参数使用默认比较好)

2.HBase客户端使用优化：

用表池或创建多个客户端，适当提高HBase客户端写入的并发性；
尽可能批量写和批量读，减少RPC交互的次数；
不要读取不必要的列数据，限定scan的数据范围；
读取到客户端的结果后，一定要关闭结果集，即关闭Results和ReultsScanner;
根据HBase CPU的利用率，合时设置压缩算法，前提是要服务需要安装压缩算法包;
6.关闭AutoFlush ，设置setAutoToFlush(false) 不建议，有丢数据的风险;

7.关闭WAL Flag，设置setWriteToWAL(false), 不建议，有丢数据的风险;

3. 建表时优化:

1.根据不同的业务，合理地设置好HBase表命名空间；

创建预分区，减少region分裂的次数，并且写入的负载也比较好；
动态添加分区，在HBase后面新的稳定版本中会有这个功能，华为、阿里、facebook公司内部二次开发的HBase已经添加了这个功能；

4. 运维时优化：

业务低峰期时，手动或定进均衡；
业务高峰期时，关闭自动负载（不建议使用）；

5 .配置参数优化：

设置StoreFile的大小：根据业务场景适当增大hbase.hregion.max.filesize减少写入过程中split的次数，同时也减少了Region的数量，新版本默认是10G，老版本默认是512M，新版本建议用默认值；
设置memstore固定缓冲区块的大小：hbase.hregion.memstore.mslab.chunksize, 默认是2M, 最好是根据一次写入数据大小进行评估，建议用默认值;
减少Zookeeper超时的发生： zookeeper.session.timeout, 默认是3分钟，可以修改为一分钟或半分钟，加快HMaster发现故障的regionServer；
增加处理线程： hbase.regionserver.handler.cout, 默认值为10，如果批量写，这个值可以设置小些，如果是单个读写，这个值可以适当设置大些；
启用数据压缩：推荐使用Snappy或者LZO压缩，前提是需要安装这个压缩算法的jar包，然后再进行配置，重启；
适当增加块缓存的大小： perf.hfile.block.cache.size 默认为0.2，这个需要查看内存刷写到磁盘的频率，如果不是很频繁，可以适当增加这个值的设置，建议0.2 ~ 0.3之间；
调整memStore限制： hbase.regionsever.global.memstore.upperLimit 默认为0.4 hbase.regionsever.global.memstore.lowerLimit 默认为0.35，建议把这两个值设置近些或相等；
增加阻塞时存储文件数目： hbase.hstore.blockingStoreFiles 默认值为7，当一个region的StoreFile的个数超过值的时候，更新就会阻塞, 在高并写的情况下，设置为10左右比较为合理；
增加阻塞倍率： hbase.region.memstore.block.multiplier 默认值是2，当memstore达到multiplier 乘以flush的大小时，写入就会阻塞，对于写压力比较大，可以增加这个值，一般为设置为2-4；
减少最大日志文件限制： hbase.regionserver.maxlogs 默认是32，对于写压力比较大的情况，可以减少这个值的设置, 加快后台异步线程的定时清理工作；

Hbase优化总结的更多相关文章

Spark读Hbase优化 --手动划分region提高并行数
一. Hbase的region 我们先简单介绍下Hbase的架构和Hbase的region: 从物理集群的角度看,Hbase集群中,由一个Hmaster管理多个HRegionServer,其中每个HR ...
HBASE 优化之REGIONSERVER
HBASE 优化之REGIONSERVER 一,概述本人在使用优化regionserver的过程有些心得,借此随笔的机会,向大家介绍我的心得,有些是网上拿来的有些是自己在使用过程自己的经验,希望对大 ...
Hbase优化方案
1.预分区设计真正存储数据的是region要维护一个区间段的rowkey startRow~endRowkey ->手动设置预分区 create 'user_p','info','partit ...
大数据技术之_11_HBase学习_02_HBase API 操作 + HBase 与 Hive 集成 + HBase 优化
第6章 HBase API 操作6.1 环境准备6.2 HBase API6.2.1 判断表是否存在6.2.2 抽取获取 Configuration.Connection.Admin 对象的方法以及关 ...
HBase优化相关
1.HBase预分区 HBase在创建表时,默认会自动创建一个Region分区.在导入数据时,所有客户端都向这个Region写数据,直到这个Region足够大才进行切分.这样在大量数据并行写入时,容易 ...
HBase之二：Hbase优化
1. 预先分区默认情况下,在创建 HBase 表的时候会自动创建一个 Region 分区,当导入数据的时候,所有的 HBase 客户端都向这一个 Region 写数据,直到这个 Region ...
HBase优化实战
本文来自网易云社区. 背景 Datastream一直以来在使用HBase分流日志,每天的数据量很大,日均大概在80亿条,10TB的数据.对于像Datastream这种数据量巨大.对写入要求非常高,并且 ...
hbase优化小结
目录: 1,背景 2,GC 3,hbase cache 4,compaction 5,其他 1,背景项目组中,hbase主要用来备份mysql数据库中的表.主要通过接入mysql binlog,经s ...
Hbase优化：（待重点研究）
一.服务端调优 1.参数配置 1).hbase.regionserver.handler.count:该设置决定了处理RPC的线程数量,默认值是10,通常可以调大,比如:150,当请求内容很大(上MB ...

随机推荐

CF-1110 (2019/02/08)
CF-1110 A. Parity 快速幂的思想,考虑最后一位即可 #include <bits/stdc++.h> using namespace std; typedef long l ...
2018 CCF NOIP提高组&&普及组答案
答案: 这是今年的答案大家觉得能进到复赛吗? 下一篇文章将会为大家推荐我自己出的复赛题!!!
HDU-1009-肥鼠交易
这题是一道简单的可拆分的贪心题目,需要注意的是,我们定义的结构体里面都应该用double类型, 或者float类型,不然两个int相除,就失去了精度(强转也可以). #include <cstd ...
2018-10-09中国裁判文书网爬虫vl5x和DocID分析
本来是想要抓取食药监的药品数据,看到js加密很繁琐,调了一个星期没有结果,想看看其他类似网站的js加密情况,发现裁判文书网的加密好像不是太复杂,经过两天的分析和编写,基本把vl5x加密和DocID解密 ...
centos 7 中文乱码的解决办法
@@首先查看系统的操作版本,我的版本是centos 7.2 的. @@查看系统是否有安装中文语言包,一般我们在安装的时候系统都会默认的为我们安装上去的. locale -a | grep " ...
日志logging
日志: 日志分为5个级别:debug(10),info(20),warning(30),error(40),critical(50) 日志四个组成部分:logger,handler,filter,fo ...
启动myeclipse出现JVM terminated. Exit code=-1
在启动myeclipse时出现如图: 解决方法第一种: myeclipse.ini中内存设置过大导致修改: 256m改成128m,512m 改为 256m. 第二种:在myeclipse.ini ...
errno的定义
./include/asm-generic/errno-base.h -->包含errno=~ ./arch/arm/include/asm/errno.h -->包含/include/a ...
django的rest framework框架——版本、解析器、序列化
一.rest framework的版本使用 1.版本可以写在URL中,通过GET传参,如 http://127.0.0.1:8082/api/users/?version=v1 (1)自定义类获取版本 ...
Java列出接口实现的所有接口
package com.tj; public class MyClass2 { public static void main(String[] args) { Class cls = java.ut ...

Hbase优化总结

1.JVM参数优化:

2.HBase客户端使用优化：

3. 建表时优化:

4. 运维时优化：

5 .配置参数优化：

Hbase优化总结的更多相关文章

随机推荐

热门专题