1.Java代码实现

import org.apache.hadoop.hbase.client.coprocessor.AggregationClient;

import org.apache.hadoop.hbase.client.coprocessor.LongColumnInterpreter;

import org.apache.hadoop.hbase.coprocessor.AggregateImplementation;

/**

* <p>

* 协处理器统计HBase表数据量

* </p>

*

*/

public class HBaseRecordsCounter {

/**

* HBase API添加协处理器

* */

public static void addCoprocessor(Configuration conf, String tableName) {

try {

byte[] tableNameBytes = Bytes.toBytes(tableName);
HBaseAdmin hbaseAdmin = new HBaseAdmin(conf);
HTableDescriptor htd = hbaseAdmin.getTableDescriptor(tableNameBytes);
if (!htd.hasCoprocessor(AggregateImplementation.class.getName())) {
hbaseAdmin.disableTable(tableNameBytes);
htd.addCoprocessor(AggregateImplementation.class.getName());
hbaseAdmin.modifyTable(tableNameBytes, htd);
hbaseAdmin.enableTable(tableNameBytes);
}

hbaseAdmin.close();

} catch (MasterNotRunningException e) {

e.printStackTrace();

} catch (ZooKeeperConnectionException e) {

e.printStackTrace();

} catch (IOException e) {

e.printStackTrace();

}

}

/**

* 统计表数量

*

*/

public static void exeCount(Configuration conf, String tableName, String family) {

try {

  // 使用hbase提供的聚合coprocessor

  AggregationClient aggregationClient = new AggregationClient(conf);

  Scan scan = new Scan();

  // 指定扫描列族，唯一值

  scan.addFamily(Bytes.toBytes(family));

  long start = System.currentTimeMillis();

  long rowCount = aggregationClient.rowCount(TableName.valueOf(tableName), new LongColumnInterpreter(), scan);

  System.out

  .println("Row count: " + rowCount + "; time cost: " + (System.currentTimeMillis() - start) + "ms");

} catch (Throwable e) {

  e.printStackTrace();

}

}

public static void main(String[] args) {

  String tableName = "test";

  Configuration conf = new Configuration();

  conf.set("hbase.zookeeper.quorum", "host1,host2,host3");

  conf.set("hbase.rootdir", "hdfs://host:8020/hbase");

  // 提高RPC通信时长

  conf.setLong("hbase.rpc.timeout", 600000);

  // 设置Scan缓存

  conf.setLong("hbase.client.scanner.caching", 1000);

  addCoprocessor(conf, tableName);

  exeCount(conf, tableName, "info");

}

}

2. 启用协处理器

启用协处理器方法1.

启动全局aggregation，能过操纵所有的表上的数据。通过修改hbase-site.xml这个文件来实现，只需要添加如下代码：

<property>

   <name>hbase.coprocessor.user.region.classes</name>

   <value>org.apache.hadoop.hbase.coprocessor.AggregateImplementation</value>

 </property>

启用协处理器方法2.

hbase shell添加coprocessor:

disable 'member'
alter 'member',METHOD => 'table_att','coprocessor' => 'hdfs://master24:9000/user/hadoop/jars/test.jar|mycoprocessor.SampleCoprocessor|1001|'
enable 'member'

hbase shell 删除coprocessor:

disable 'member'
alter 'member',METHOD => 'table_att_unset',NAME =>'coprocessor$1'
enable 'member'

HBase协处理器统计表数据量的更多相关文章

统计Azure存储的HBase各表数据量
场景:HBase存储在Azure上,现在通过访问Azure Storage的接口,获取HBase中各个表的数据量. 注意: 1.Azure存储,默认的副本数为2,即共存3份,但只收1份的费用,取到的s ...
hbase数据加盐（Salting）存储与协处理器查询数据的方法
转自: https://blog.csdn.net/finad01/article/details/45952781 ----------------------------------------- ...
HBase协处理器同步二级索引到Solr
一. 背景二. 什么是HBase的协处理器三. HBase协处理器同步数据到Solr四. 添加协处理器五. 测试六. 协处理器动态加载一. 背景在实际生产中,HBase往往不能满足多维度分析,我们 ...
大数据量场景下storm自定义分组与Hbase预分区完美结合大幅度节省内存空间
前言:在系统中向hbase中插入数据时,常常通过设置region的预分区来防止大数据量插入的热点问题,提高数据插入的效率,同时可以减少当数据猛增时由于Region split带来的资源消耗.大量的预分 ...
pinpoint 单机HBASE数据量过大问题解决
Pinpoint接入业务监控后数据量大涨,平均每周Hbase数据增量35G左右,数据量太大,需要对数据进行定期清理,否则监控可用性降低. 操作步骤查找出数据大的hbase表 [root@iZ28ov ...
大数据开发--Hbase协处理器案例
大数据开发--Hbase协处理器案例 1. 需求描述在社交网站,社交APP上会存储有大量的用户数据以及用户之间的关系数据,比如A用户的好友列表会展示出他所有的好友,现有一张Hbase表,存储就是当前 ...
[How to] 使用HBase协处理器---Endpoint客户端代码的实现
1.简介不同于Observer协处理器,EndPoint由于需要同region进行rpc服务的通信,以及客户端出数据的归并,需要自行实现客户端代码. 基于[How to] 使用HBase协处理器-- ...
[How to] 使用HBase协处理器---Endpoint服务端的实现
1.简介前篇文章[How to] 使用HBase协处理器---基本概念和regionObserver的简单实现中提到了两种不同的协处理器,并且实现了regionObserver. 本文将介绍如何使用 ...
HBase 协处理器编程详解第一部分：Server 端代码编写
Hbase 协处理器 Coprocessor 简介 HBase 是一款基于 Hadoop 的 key-value 数据库,它提供了对 HDFS 上数据的高效随机读写服务,完美地填补了 Hadoop M ...

随机推荐

图文详解YUV420， yuv格式2
YUV格式有两大类:planar和packed. 对于planar的YUV格式,先连续存储所有像素点的Y,紧接着存储所有像素点的U,随后是所有像素点的V. 对于packed的YUV格式,每个像素点的Y ...
iOS汉字中提取首字母
NSMutableString *mutableStr = [[NSMutableString alloc]initWithString:string]; if (CFStringTransform( ...
protected（C# 参考）
protected 关键字是一个成员访问修饰符.受保护成员在它的类中可访问并且可由派生类访问.有关 protected 与其他访问修饰符的比较,请参见可访问性级别. 仅当访问通过派生类类型发生时,基类 ...
OI再见
以下是一只蒟蒻的回忆： 1.进入高一小县城不重视OI，直到进了高中才知道有OI这个东西，于是我就开始了OI…（看，够弱的吧，相信你是小学就开始学了）学了几天Pascal语法后，被老师报上了NOIP ...
PTS PCR DTS 详解
一.引言 MPEG-2系统用于视音频同步以及系统时钟恢复的时间标签分别在ES,PES和TS这3个层次中.在ES层,与同步有关的主要是视频缓冲验证VBV(Video Buffer Verifier),用 ...
jsp中如何取得当前页面完整的URL
JSP页面 <% String url = request.getScheme()+"://"+ request.getServerName()+request.getReq ...
jq实现多banner效果图
<!DOCTYPE html> <html> <head> <meta charset="UTF-8" /> <title&g ...
Hadoop及子项目备注
Hadoop CommonHadoop体系最底层的一个模块,为Hadoop各子项目提供各种工具,如:配置文件和日志操作等. AvroAvro是doug cutting主持的RPC项目,有点类似Goog ...
POJ 3321 Apple Tree（DFS序+线段树单点修改区间查询）
Apple Tree Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 25904 Accepted: 7682 Descr ...
POJ 1062 dij
一道读题读的不明所以的题... 每个人只能接受和自己等级差距不超过m的人进行交易包括间接交易所以我们可以枚举每一个长度为m的围绕着酋长的等级区间每次都对这个等级区间内的人进行操作求dis[1] ...