使用BulkLoad恢复hbase数据

问题:

hbase 集群启动不了,maste一直在初始化，数据面临丢失风险。

解决:

把hbfs上 /hbase 目录移走改名为/hbase-bak
删除zk上的数据,重新建立一个新的hbase集群.
使用如下代码, 把/hbase-bak里面的数据恢复到现有的hbase集群中.

public class RestoreData {

    public static final String HBASE_ZOOKEEPER_QUORUM = "hbase.zookeeper.quorum";

    public static final String HBASE_CLIENT_RETRIES_NUMBER = "hbase.client.retries.number";

    public static final String HBASE_MASTER_INFO_PORT = "hbase.master.info.port";

    public static final String HBASE_ZOOKEEPER_PROPERTY_CLIENTPORT = "hbase.zookeeper.property.clientPort";

    public static final String HBASE_RPC_TIMEOUT = "hbase.rpc.timeout";

    public static final String HBASE_CLIENT_OPERATION_TIMEOUT = "hbase.client.operation.timeout";

    public static final String HBASE_CLIENT_SCANNER_TIMEOUT_PERIOD = "hbase.client.scanner.timeout.period";

    public static final String HBASE_WRITEBUFFER_SIZE = "hbase.writebuffer.size";

    private static Connection hbaseConn;

    private static Configuration hbaseConf;

    public static void main(String[] args) throws IOException {

        hbaseConf = HBaseConfiguration.create();

        hbaseConf.set(HBASE_ZOOKEEPER_QUORUM, "master");

        hbaseConf.set(HBASE_ZOOKEEPER_PROPERTY_CLIENTPORT, "2181");

        hbaseConf.set(HBASE_RPC_TIMEOUT, "30000");

        hbaseConf.set(HBASE_CLIENT_OPERATION_TIMEOUT, "30000");

        hbaseConf.set(HBASE_CLIENT_SCANNER_TIMEOUT_PERIOD, "30000");

        hbaseConn = ConnectionFactory.createConnection(hbaseConf);

        String hfile = "hdfs://master:9000/hbase-bak/data/default/student/ab4112439aee7a2dea88f1b5119f0f4d";

        String tableName = "student";

        String[] array = new String[2];

        array[0] = hfile;

        array[1]  = tableName;

        try {

            new LoadIncrementalHFiles(hbaseConf).run(array);

        } catch (Exception e) {

            e.printStackTrace();

        }

    }

}

pom文件

<dependencies>

        <dependency>

            <groupId>org.apache.hbase</groupId>

            <artifactId>hbase-client</artifactId>

            <version>1.4.13</version>

        </dependency>

        <dependency>

            <groupId>org.apache.hbase</groupId>

            <artifactId>hbase-server</artifactId>

            <version>1.4.13</version>

        </dependency>

        <dependency>

            <groupId>org.apache.hbase</groupId>

            <artifactId>hbase-common</artifactId>

            <version>1.4.13</version>

        </dependency>

        <dependency>

            <groupId>org.apache.hadoop</groupId>

            <artifactId>hadoop-core</artifactId>

            <version>1.0.4</version>

        </dependency>

        <dependency>

            <groupId>org.apache.hadoop</groupId>

            <artifactId>hadoop-client</artifactId>

            <version>2.8.3</version>

        </dependency>

        <dependency>

            <groupId>log4j</groupId>

            <artifactId>log4j</artifactId>

            <version>1.2.17</version>

        </dependency>

        <dependency>

            <groupId>org.apache.hbase</groupId>

            <artifactId>hbase-hadoop2-compat</artifactId>

            <version>1.4.13</version>

        </dependency>

    </dependencies>

打包

脚本

在集群上运行的脚本

export LD_LIBRARY_PATH=/data/hadoop-2.8.3/lib/native

java -cp /data/hadoop/data/hbase_production.jar\

:/data/hbase/lib/log4j-1.2.17.jar\

:/data/hbase/lib/slf4j-log4j12-1.7.25.jar\

:/data/hbase/lib/slf4j-api-1.7.25.jar\

:/data/hbase/lib/snappy-java-1.0.5.jar\

:/data/hadoop-2.8.3/share/hadoop/common/hadoop-nfs-2.8.3.jar\

:/data/hadoop-2.8.3/share/hadoop/common/hadoop-common-2.8.3.jar\

com.xxxx.hbase.RestoreData \

hdfs://master:9000/hbase-bak/data/default/student/$1 \

student

执行

./脚本  HFile路径

也可用于hbase 备份.

使用BulkLoad恢复hbase数据的更多相关文章

使用bulkload向hbase中批量写入数据
1.数据样式写入之前,需要整理以下数据的格式,之后将数据保存到hdfs中,本例使用的样式如下(用tab分开): row1 N row2 M row3 B row4 V row5 N row6 M r ...
HBase数据备份及恢复(导入导出)的常用方法
一.说明随着HBase在重要的商业系统中应用的大量增加,许多企业需要通过对它们的HBase集群建立健壮的备份和故障恢复机制来保证它们的企业(数据)资产.备份Hbase时的难点是其待备份的数据集可能非 ...
HBase BulkLoad批量写入数据实战
1.概述在进行数据传输中,批量加载数据到HBase集群有多种方式,比如通过HBase API进行批量写入数据.使用Sqoop工具批量导数到HBase集群.使用MapReduce批量导入等.这些方式, ...
HBase 数据迁移方案介绍
一.前言 HBase数据迁移是很常见的操作,目前业界主要的迁移方式主要分为以下几类: 图1.HBase数据迁移方案从上面图中可看出,目前的方案主要有四类,Hadoop层有一类,HBase层有三类.下 ...
HBase 数据迁移方案介绍 (转载)
原文地址:https://www.cnblogs.com/ballwql/p/hbase_data_transfer.html 一.前言 HBase数据迁移是很常见的操作,目前业界主要的迁移方式主要分 ...
BigData NoSQL —— ApsaraDB HBase数据存储与分析平台概览
一.引言时间到了2019年,数据库也发展到了一个新的拐点,有三个明显的趋势: 越来越多的数据库会做云原生(CloudNative),会不断利用新的硬件及云本身的优势打造CloudNative数据库, ...
HBase 数据迁移方案介绍（转载）
原文链接:https://www.cnblogs.com/ballwql/p/hbase_data_transfer.html 一.前言 HBase数据迁移是很常见的操作,目前业界主要的迁移方式主要分 ...
4.HBASE数据迁移方案（之snapshot）：
4.HBASE数据迁移方案: 4.1 Import/Export 4.2 distcp 4.3 CopyTable 4.4 snapshot 快照方式迁移(以USER_info:user_lo ...
HBase 数据迁移
最近两年负责 HBase,经常被问到一些问题, 本着吸引一些粉丝.普及一点HBase 知识.服务一点阅读人群的目的,就先从 HBase 日常使用写起,后续逐渐深入数据设计.集群规划.性能调优.内核源码 ...

随机推荐

算法基础——KMP字符串匹配
原题链接题目: 给定一个模式串S,以及一个模板串P,所有字符串中只包含大小写英文字母以及阿拉伯数字. 模板串P在模式串S中多次作为子串出现. 求出模板串P在模式串S中所有出现的位置的起始下标. 输入 ...
深度分析：java8的新特性lambda和stream流，看完你学会了吗？
1. lambda表达式 1.1 什么是lambda 以java为例,可以对一个java变量赋一个值,比如int a = 1,而对于一个方法,一块代码也是赋予给一个变量的,对于这块代码,或者说被赋给变 ...
CorelDRAW X7 X8 2017 2018是什么关系？
从CorelDRAW 2017版本开始我们叫习惯了的X几系列的CorelDRAW毅然决然的就换了称呼,所以有时候很多朋友对于软件版本,经常会傻傻分不清,还有人认为X8版本比2017版本高,究竟为什么会 ...
学习django笔记一：在urls.py中导入sign应用views文件的问题
>python-admin startproject guest #创建guest项目 >python3 manage.py startapp sign #在guest项目中创建 ...
iOS如何实现语音播报及后台播放
最近项目刚刚交付,偶然间用到了语音播报和语音搜索的功能.语音搜索我用的是讯飞的demo,感觉效果还不错,感兴趣的话可以去官网上面下载demo,里面讲的特别的详细,不过稍显麻烦一些.语音播报讯飞也有de ...
模拟赛41 A. 四个质数的和
题目描述给定了一个正整数 \(N\).有多少种方法将 \(N\) 分解成为四个质数 \(a,b,c,d\)的和. 例如: \(9=2+2+2+3=2+2+3+2=2+3+2+2=3+2+2+2\), ...
Crossing River 题解(贪心)
题目链接题目大意 t组数据(t<=20) 给你n个人(n<=1000)过河,每个人都有权值,一条船,每次船最多运2个人,每次的花费为两个人的较大花费求所有人都过河需要的最小花费题目思 ...
2020.11.26 IntellJ idea激活码失效解决方法（最新idea激活码及安装参数！）
今天是2020年11月26号,小伙伴们是不是有发现自己的idea激活码失效了,不瞒大家,小编也是一个JAVA开发者,到了公司打开idea,然后就发现事情不妙,经过1个多小时的摸索,终于把最近的安装参数 ...
课时一：JS操作数据
课时一:JS操作数据 JSAPI请求头 xmlhttp.setRequestHeader("Content-Type", "application/json; chars ...
day102:MoFang:后端完成对短信验证码的校验&基于celery完成异步短信发送&flask_jwt_extended&用户登录的API接口
目录 1.用户注册 1.后端完成对短信验证码的校验 2.基于celery实现短信异步发送 2.用户登录 1.jwt登录验证:flask_jwt_extended 2.服务端提供用户登录的API接口 1 ...

使用BulkLoad恢复hbase数据

问题:

解决:

pom文件

打包

脚本

执行

使用BulkLoad恢复hbase数据的更多相关文章

随机推荐

热门专题