sqoop 安装

Sqoop是一款开源的工具，主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递，可以将一个关系型数据库（例如： MySQL ,Oracle ,Postgres等）中的数据导进到Hadoop的HDFS中，也可以将HDFS的数据导进到关系型数据库中。Sqoop项目开始于2009年，最早是作为Hadoop的一个第三方模块存在，后来为了让使用者能够快速部署，也为了让开发人员能够更快速的迭代开发，Sqoop独立成为一个Apache项目。
总之Sqoop是一个转换工具，用于在关系型数据库与HDFS之间进行数据转换。

sqoop 安装步骤如下：

1.下载，指定到目录下

下载路径：https://mirrors.tuna.tsinghua.edu.cn/apache/sqoop/1.4.7/

选择版本：sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz

安装在master主节点上。

解压：gunzip -d sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz

tar -xvf sqoop-1.4.7.bin__hadoop-2.6.0.tar

mv sqoop-1.4.7.bin__hadoop-2.6.0 sqoop-1.4.7

cd sqoop-1.4.7/

cp sqoop-env-template.sh sqoop-env.sh

vi sqoop-env.sh --根据具体内容填写

# Set Hadoop-specific environment variables here.

#Set path to where bin/hadoop is available

#export HADOOP_COMMON_HOME=/home/hadoop/hadoop-2.7.

#Set path to where hadoop-*-core.jar is available

#export HADOOP_MAPRED_HOME=/home/hadoop/hadoop-2.7.

#set the path to where bin/hbase is available

#export HBASE_HOME=/home/hadoop/hbase

#Set the path to where bin/hive is available

#export HIVE_HOME=/home/hadoop/hive

#Set the path for where zookeper config dir is

#export ZOOCFGDIR=/home/hadoop/zookeeper

2.添加环境变量：

vi .bash_profile

export SQOOP_HOME=/home/hadoop/sqoop-1.4.

export PATH=$PATH:${SQOOP_HOME}/bin

export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export CLASSPATH=$CLASSPATH:${SQOOP_HOME}/lib

使文件生效：

source .bash_profile

3.复制相关依赖包$SQOOP_HOME/lib

下载MySQL的依赖包

mysql-connector-java-5.1.46-bin.jar 点击打开链接

上传解压后，把mysql-connector-java-5.1.46-bin.jar 移动到/home/hadoop/sqoop-1.4.7/lib 下

cd /home/hadoop/hadoop-2.7.3/share/hadoop/common

cp hadoop-common-2.7.3.jar /home/hadoop/sqoop-1.4.7/lib/

4.修改$SQOOP_HOME/bin/configure-sqoop

注释掉HCatalog，Accumulo检查(除非你准备使用HCatalog，Accumulo等HADOOP上的组件)

## Moved to be a runtime check in sqoop.

#if [ ! -d "${HCAT_HOME}" ]; then

#  echo "Warning: $HCAT_HOME does not exist! HCatalog jobs will fail."

#  echo 'Please set $HCAT_HOME to the root of your HCatalog installation.'

#fi

#if[ ! -d "${ACCUMULO_HOME}" ]; then

#  echo "Warning: $ACCUMULO_HOME does notexist! Accumulo imports will fail."

#  echo 'Please set $ACCUMULO_HOME to the rootof your Accumulo installation.'

#fi

#Add HCatalog to dependency list

#if[ -e "${HCAT_HOME}/bin/hcat" ]; then

# TMP_SQOOP_CLASSPATH=${SQOOP_CLASSPATH}:`${HCAT_HOME}/bin/hcat-classpath`

#  if [ -z "${HIVE_CONF_DIR}" ]; then

#   TMP_SQOOP_CLASSPATH=${TMP_SQOOP_CLASSPATH}:${HIVE_CONF_DIR}

#  fi

#  SQOOP_CLASSPATH=${TMP_SQOOP_CLASSPATH}

#fi

#Add Accumulo to dependency list

#if[ -e "$ACCUMULO_HOME/bin/accumulo" ]; then

#  for jn in `$ACCUMULO_HOME/bin/accumuloclasspath | grep file:.*accumulo.*jar |cut -d':' -f2`; do

#    SQOOP_CLASSPATH=$SQOOP_CLASSPATH:$jn

#  done

#  for jn in `$ACCUMULO_HOME/bin/accumuloclasspath | grep file:.*zookeeper.*jar |cut -d':' -f2`; do

#    SQOOP_CLASSPATH=$SQOOP_CLASSPATH:$jn

#  done

#fi

测试与mysql的连接

首先确保mysqld在运行：

[root@master ~]# service mysqld status
mysqld (pid 3052) is running...

然后测试是否连通：

[hadoop@master ~]$ sqoop list-databases --connect jdbc:mysql://127.0.0.1:3306/?useSSL=false --username root -P
19/02/18 17:38:32 INFO sqoop.Sqoop: Running Sqoop version: 1.4.7
Enter password: 
19/02/18 17:38:45 INFO manager.MySQLManager: Preparing to use a MySQL streaming resultset.
information_schema
hive
mysql
performance_schema
sys

输入密码后如果能显示你mysql上的数据库则表示已经连通。

<完>

sqoop 安装的更多相关文章

如何将mysql数据导入Hadoop之Sqoop安装
Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql.postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle , ...
Sqoop安装与应用过程
1. 参考说明参考文档: http://sqoop.apache.org/ http://sqoop.apache.org/docs/1.99.7/admin/Installation.html ...
sqoop安装部署(笔记)
sqoop是一个把关系型数据库数据抽向hadoop的工具.同时,也支持将hive.pig等查询的结果导入关系型数据库中存储.由于,笔者部署的hadoop版本是2.2.0,所以sqoop的版本是:sqo ...
sqoop安装与简单实用
一,sqoop安装 1.解压源码包 2.配置环境变量 3.在bin目录下的 /bin/configsqoop 注释掉check报错信息 4.配置conf目录下 /conf/sqoop-env.sh 配 ...
cdh版本的sqoop安装以及配置
sqoop安装需要提前安装好sqoop依赖:hadoop .hive.hbase.zookeeper hadoop安装步骤请访问:http://www.cnblogs.com/xningge/arti ...
[Hadoop] Sqoop安装过程详解
Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可 ...
hadoop(八) - sqoop安装与使用
一. sqoop安装: 安装在一台节点上就能够了. 1. 使用winscp上传sqoop 2. 安装和配置加入sqoop到环境变量将数据库连接驱动mysql-connector-5.1.8.jar ...
Sqoop 安装部署
1. 上传并解压 Sqoop 安装文件将 sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz 安装包上传到 node-01 的 /root/ 目录下并将其解压 [root@no ...
Sqoop安装及操作
一.集群环境: Hostname IP Hadoop版本 Hadoop 功能系统 node1 192.168.1.151 0.20.0 namenode hive+sqoop rhel5.4X86 ...

随机推荐

spring cloud之docker微服务客户端注册eureka问题
正常我们起一个微服务注册到eureka他的实例id是默认这样的主机名称:服务名称:服务端口号, 如果配置eureka.instance.prefer-ip-address=true则实例id为主机Ip ...
了解DrawCall
一.什么是DrawCall DrawCall的含义就是CPU调用图像编程接口,以命令GPU进行渲染的操作. CPU和GPU通过使用一个命令缓冲区实现并行工作.命令缓冲区包含一个命令队列,CPU向其中添 ...
一、linux基础命令
一. 常用系统工作命令 1.echo 命令 echo命令用于在终端输出字符串或者变量提取后的值 echo $SHELL 2.date命令 date命令用于显示及设置系统的时间或者日期参数 ...
SQL -------- JDBC 修改某条记录得内容
package demo; import java.io.IOException; import java.sql.Connection; import java.sql.DriverManager; ...
springboot整合es客户端操作elasticsearch（四）
对文档查询,在实际开发中,对文档的查询也是偏多的,记得之前在mou快递公司,做了一套事实的揽件数据操作,就是通过这个来存储数据的,由于一天的数据最少拥有3500万数据所以是比较多的,而且还要求查询速 ...
[CF544D]Destroying Roads_最短路_bfs
D. Destroying Roads 题目大意: In some country there are exactly n cities and m bidirectional roads conne ...
【转帖】Windows与Linux系统下的库介绍
Windows与Linux系统下的库介绍 http://embeddedlinux.org.cn/emb-linux/entry-level/200903/12-553.html 库的定义库文件是一 ...
Docker 运行 MYSQL 数据库的总结
公司里面要求做一个小demo 学习java相关的东西然后使用了mysql数据库很早之前做过mysql的容器化运行. 现在想想已经忘记的差不多了所以这里总结一下 docker化运行mysql数据 ...
ABP创建应用服务
原文作者:圣杰原文地址:ABP入门系列(4)——创建应用服务在原文作者上进行改正,适配ABP新版本.内容相同 1. 解释下应用服务层应用服务用于将领域(业务)逻辑暴露给展现层.展现层通过传入DT ...

sqoop 安装

sqoop 安装的更多相关文章

随机推荐

热门专题