伪分布式hbase数据迁移汇总

https://www.jianshu.com/p/990bb550be3b

hbase0.94.11（hadoop为1.1.2，此电脑ip为172.19.32.128）向hbase1.1.2 (hadoop为2.6.5，此电脑ip为172.19.32.118)数据迁移.

第一步：首先必须关闭防火墙。

Sudo ufw status （如果没有下载ufw,则sudo apt-get install ufw）

Sudo ufw enable

Sudo ufw disable

Sudo ufw allow|deny 8000

第二步进行迁移

　　方式一：

　　用snapshot进行数据迁移时需要localhost的地方把hadoop的core-site.xml中的fs.default.name设置为localhost。不要使用本机ip,即172.19.32.128。

　　方式二：

　　使用hadoop fs –cp命令，进行数据迁移时，双方的ip必须按照hadoop的core-site.xml中的fs.default.name来写。（src中配置为localhost,des中配置是其本机的地址，即172.19.32.118）.

　　方式三：

　　使用hadoop的distcp工具进行数据迁移：

数据迁移总结：

　　　1. hadoop distcp

　　　　将hbase存储在hdfs上面的数据目录全部从当前集群拷贝至目标集群hbase对应的hdfs目录；

　　　　hadoop distcp -f hbasedir "hdfs://new cluster ip:9000/hbasedir

　　　　说明：此方案只适用于离线迁移；且测试由0.94–》1.1.2版本测试失败。同版本的数据迁移（备份）没问题。

　　　　2. hadoop fs –cp

　　　　此操作可以进行本地文件系统和hdfs中数据的导入导出。实现两个集群的hdfs进行，此操作需要消耗大量的网络带宽，速度慢。测试由0.94–》1.1.2版本测试失败。

　　　　3.hbase –snapshot

　　　　此操作进行数据迁移比较高效，较推荐。测试由0.94–》1.1.2版本测试失败。

以上三种都需要注意ip的设置。

伪分布式hbase数据迁移汇总的更多相关文章

HBase 数据迁移方案介绍
一.前言 HBase数据迁移是很常见的操作,目前业界主要的迁移方式主要分为以下几类: 图1.HBase数据迁移方案从上面图中可看出,目前的方案主要有四类,Hadoop层有一类,HBase层有三类.下 ...
HBase 数据迁移方案介绍 (转载)
原文地址:https://www.cnblogs.com/ballwql/p/hbase_data_transfer.html 一.前言 HBase数据迁移是很常见的操作,目前业界主要的迁移方式主要分 ...
HBase 数据迁移方案介绍（转载）
原文链接:https://www.cnblogs.com/ballwql/p/hbase_data_transfer.html 一.前言 HBase数据迁移是很常见的操作,目前业界主要的迁移方式主要分 ...
Hive及HBase数据迁移
一. Hive数据迁移场景:两个Hadoop平台集群之间Hive表迁移. 基本思路:Hive表元数据和文件数据export到HDFS文件,通过Distcp将HDFS迁移到另一个集群的HDFS文件,再 ...
4.HBASE数据迁移方案（之snapshot）：
4.HBASE数据迁移方案: 4.1 Import/Export 4.2 distcp 4.3 CopyTable 4.4 snapshot 快照方式迁移(以USER_info:user_lo ...
HBase 数据迁移
最近两年负责 HBase,经常被问到一些问题, 本着吸引一些粉丝.普及一点HBase 知识.服务一点阅读人群的目的,就先从 HBase 日常使用写起,后续逐渐深入数据设计.集群规划.性能调优.内核源码 ...
HBase数据迁移到Kafka实战
1.概述在实际的应用场景中,数据存储在HBase集群中,但是由于一些特殊的原因,需要将数据从HBase迁移到Kafka.正常情况下,一般都是源数据到Kafka,再有消费者处理数据,将数据写入HBas ...
Ubuntu 14.10 下安装伪分布式hbase 0.99.0
HBase 安装分为:单击模式,伪分布式,完全分布式,在单机模式中,HBase使用本地文件系统而不是HDFS ,所有的服务和zooKeeper都运作在一个JVM中.本文是安装的伪分布式. 安装步骤如下 ...
ambari之hbase数据迁移
一.hbase原理剖析 Base是一个构建在HDFS上的分布式列存储系统:HBase是基于Google BigTable模型开发的,典型的key/value系统:HBase是Apache Hadoop ...

随机推荐

MySQL--（了解）可能会用到的内置函数
mysql内置函数列表可以从mysql官方文档查询,这里仅分类简单介绍一些可能会用到的函数.1 数学函数abs(x)pi()mod(x,y)sqrt(x)ceil(x)或者ceiling(x)rand ...
【ORIGINATE】详解
originate 用法如下: originate <call url> <exten> |&<application_name>(<app_args ...
ajax返回的欧洲字符（例如：法文）乱码
ajax返回值的乱码现象产生的相关代码如下: Java代码: JsonObject jsonObject = new JsonObject(); jsonObject.addProperty(&quo ...
关于KEIL编译报错和警告问题
编译时候报错.. Library reports error: __use_no_semihosting was requested, but _ttywrch was referenced 上网找了 ...
Jenkins五配置tomcat
一:jdk安装查看系统自带jdk版本并卸载 [root@localhost conf]# rpm -qa|grep jdkjdk1.8-1.8.0_201-fcs.x86_64 移除: yum re ...
Java感情
不知道怎么会执着于这一门语言.论速度的话,c那系更好一些,而且对底层的操控更多是c那边的.还是想通过Java做这些事. 对Java不怎么懂,它的底层实现是怎样的.只知道一个大体的思想,不知道具体步骤. ...
不想用ssh框架
学过三遍多的样子,没有感悟到特别多的好处. 现在工作都用,想找一个不用这个的工作就不好找.c的话,觉得没有Java面向对象提炼得好. 不是很明白怎么都用,知道自己不想用.里边太多复杂和要背下来的东西, ...
CentOS6文件系统思维导图
Confluence 6 数据模型
本文档提供了 Confluence 的数据结构视图(schema )和数据模型概念上的的概述. 备注: Hibernate 的映射文件是针对 Confluence 数据模型的直接描述.在系统中的 Co ...
jenkins默认会存放目录
jenkins默认会存放在用户主目录下的.jenkins文件夹中如:Linux root用户:/root/.jenkins 注意:这是linux版本的.windows系统请自行更改.这个值在Jenk ...

伪分布式hbase数据迁移汇总

伪分布式hbase数据迁移汇总的更多相关文章

随机推荐

热门专题