关于HBase的memstoreFlushSize。

memstoreFlushSize是什么呢？

memstoreFlushSize为HRegion上设定的一个阈值，当MemStore的大小超过这个阈值时，将会发起flush请求。

它的计算首先是由Table决定的，即每个表可以设定自己的memstoreFlushSize，通过关键字MEMSTORE_FLUSHSIZE来设定，

如果表中未设定，则取参数hbase.hregion.memstore.flush.size，

如果参数再无配置的话，则默认为1024*1024*128L，即128M。

★HBase版本：1.3.1

源码位置：https://github.com/apache/hbase/blob/master/hbase-server/src/main/java/org/apache/hadoop/hbase/regionserver/HRegion.java

源码内容：

void setHTableSpecificConf() {

  if (this.htableDescriptor == null) return;

  long flushSize = this.htableDescriptor.getMemStoreFlushSize();

  if (flushSize <= 0) {

    flushSize = conf.getLong(HConstants.HREGION_MEMSTORE_FLUSH_SIZE,

      HTableDescriptor.DEFAULT_MEMSTORE_FLUSH_SIZE);

  }

  this.memstoreFlushSize = flushSize;

  this.blockingMemStoreSize = this.memstoreFlushSize *

      conf.getLong(HConstants.HREGION_MEMSTORE_BLOCK_MULTIPLIER,

              HConstants.DEFAULT_HREGION_MEMSTORE_BLOCK_MULTIPLIER);

}

那么，如何设置table的memstoreFlushSize呢？这里选择了在通过java api创建表的时候进行设置。代码样例：

package api;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;

import org.apache.hadoop.hbase.HColumnDescriptor;

import org.apache.hadoop.hbase.HTableDescriptor;

import org.apache.hadoop.hbase.TableName;

import org.apache.hadoop.hbase.client.Admin;

import org.apache.hadoop.hbase.client.Connection;

import org.apache.hadoop.hbase.client.ConnectionFactory;

public class create_table_sample1 {

    public static void main(String[] args) throws Exception {

        Configuration conf = HBaseConfiguration.create();

        conf.set("hbase.zookeeper.quorum", "192.168.6.3,192.168.6.4,192.168.6.5");

        Connection connection = ConnectionFactory.createConnection(conf);

        Admin admin = connection.getAdmin();

        HTableDescriptor desc = new HTableDescriptor(TableName.valueOf("TEST1"));

        desc.setMemStoreFlushSize(2097152L);          //2M(默认128M)

        HColumnDescriptor family1 = new HColumnDescriptor(constants.COLUMN_FAMILY_DF.getBytes());

        family1.setTimeToLive(2 * 60 * 60 * 24);     //过期时间

        family1.setMaxVersions(2);                   //版本数

        desc.addFamily(family1);

        HColumnDescriptor family2 = new HColumnDescriptor(constants.COLUMN_FAMILY_EX.getBytes());

        family2.setTimeToLive(3 * 60 * 60 * 24);     //过期时间

        family2.setMaxVersions(3);                   //版本数

        desc.addFamily(family2);

        try {

            admin.createTable(desc);

        } catch (Exception e) {

            e.printStackTrace();

        }

        admin.close();

        connection.close();

    }

}

通过hbase shell也许也可以设置，不过没有试验过。

--END--

关于HBase的memstoreFlushSize。的更多相关文章

Hbase的flush机制
Hbase Flush机制最小Flush单元为HRegion,尽量减少CF数量以减少HStrore数量从而减少MemStore的数量,最终减少每次Flush的开销.1.Region级别触发条件: ...
HBase参数配置及说明
版本:0.94-cdh4.2.1 hbase-site.xml配置 hbase.tmp.dir 本地文件系统tmp目录,一般配置成local模式的设置一下,但是最好还是需要设置一下,因为很多文件都会默 ...
HBase参数配置及说明（转）
版本:0.94-cdh4.2.1 hbase-site.xml配置 hbase.tmp.dir 本地文件系统tmp目录,一般配置成local模式的设置一下,但是最好还是需要设置一下,因为很多文件都会默 ...
HBase MemStoreFlusher
HBase MemStore Flush由类org.apache.hadoop.hbase.regionserver.MemStoreFlusher实现,具体表现为HRegionServer中的一个实 ...
HBase Compact
Region Compact请求是在Region MemStore Flush之后被触发的: boolean shouldCompact = region.flushcache(); // We ju ...
hbase参数配置和说明
版本:0.94-cdh4.2.1 hbase-site.xml配置 hbase.tmp.dir 本地文件系统tmp目录,一般配置成local模式的设置一下,但是最好还是需要设置一下,因为很多文件都会默 ...
HBase的compact分析
HBase是基于LSM树存储模型的分布式NoSQL数据库.LSM树对比普遍的B+树来说,能够获得较高随机写性能的同时,也能保持可靠的随机读性能(可参考这里).在进行读请求的时候,LSM树要把多个子树( ...
HBase源代码分析之MemStore的flush发起时机、推断条件等详情
前面的几篇文章.我们具体介绍了HBase中HRegion上MemStore的flsuh流程,以及HRegionServer上MemStore的flush处理流程.那么,flush究竟是在什么情况下触发 ...
HBase表的memstore与集群memstore
一直有一个问题,今天调查了一下源码算是明白了. ===问题=== 通过java api(如下代码所示)在创建表的时候,可以通过setMemStoreFlushSize函数来指定memstore的大小, ...

随机推荐

java web 程序---在线时长
思路:toLocalString()这个方法 <body> <% long t=session.getLastAccessedTime(); long t2=session.getC ...
iRedMail的搭建过程记录
iRedMail的搭建和注意事项经过一段时间的折腾,终于将iRedMail搭建起来了,下面介绍一下搭建的过程,以及注意事项. 注意事项: 1. iRedMail不支持重复安装,如果安装错误,请重置 ...
Git版本控制：Github的使用之多人协作及参与项目
版权声明:本文为博主皮皮http://blog.csdn.net/pipisorry原创文章,未经博主允许不得转载. 目录(?)[-] Git多人协作从远程库克隆使用GitHub参与开源项目- ...
python学习笔记(十四): unittest
Python中有一个自带的单元测试框架是unittest模块,用它来做单元测试,它里面封装好了一些校验返回的结果方法和一些用例执行前的初始化操作. 在说unittest之前,先说几个概念: TestC ...
简单获取各大视频网站的flash地址
最近做网站的时候遇到一个需求:给定一个视频地址,获取它的swf地址.例如,给一个优酷的视频地址:http://v.youku.com /v_show/id_XNDg4MzY5ODU2.html,想获取 ...
winform中读取App.config中数据连接字符串
1.首先要在工程引用中导入System.Configuration.dll文件的引用. 2.通过System.Configuration.ConfigurationManager.Connection ...
Django学习笔记之Class-Based-View
Django写的多了,有些问题才逐渐认识到. 比如有一个view比较复杂,调用了很多其他的函数.想要把这些函数封装起来,怎么办? 当然,可以用注释#------view------这样将函数隔离开,这 ...
Spring Boot实践——SpringMVC视图解析
一.注解说明在spring-boot+spring mvc 的项目中,有些时候我们需要自己配置一些项目的设置,就会涉及到这三个,那么,他们之间有什么关系呢? 首先,@EnableWebMvc=Web ...
Python中的列表生成式和多层表达式
Python中的列表生成式和多层表达式如何生成[1x1, 2x2, 3x3, ..., 10x10]的列表? L=[]; ,): L.append(x*x) print L print (" ...
MyBatis 学习记录6 TypeHandler
主题因为对MyBatis在JDBC数据和Java对象之间数据转化比较感兴趣,所以就记录并学习一下TypeHandler. 使用场景如上图所示,观察下接口方法就能明白.TypeHandler主要用于 ...

关于HBase的memstoreFlushSize。

关于HBase的memstoreFlushSize。的更多相关文章

随机推荐

热门专题