Sqoop是一个用来完成Hadoop和关系型数据库中的数据相互转移的工具,

他可以将关系型数据库(MySql,Oracle,Postgres等)中的数据导入Hadoop的HDFS中,

也可以将HDFS的数据导入关系型数据库中。

前期准备:

1.Sqoop需要安装在成功部署的Hadoop平台上,并且要求Hadoop已经正常启动。hadoop集群的搭建

2.安装了mysql数据库,并且已经启动.CentOS安装mysql源码包

3.下载mysql-connector-java-5.1.12.tar.gz。

安装过程;

1.下载sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz压缩包。

2.上传至/usr/local/src

3.解压缩并且移动到上级目录(/usr/local)

4.解压缩mysql-connector-java-5.1.12.tar.gz文件,

并且复制文件mysql-connector-java-5.1.12-bin.jar到/usr/local/sqoop-1.4.7.bin__hadoop-2.6.0/lib中。

5.配置环境变量  

  1. cd /usr/local/sqoop-1.4..bin__hadoop-2.6./conf
    cp sqoop-env-template.sh sqoop-env.sh
    vim sqoop-env.sh

根据情况添加配置信息 内容如下:

  1. # Licensed to the Apache Software Foundation (ASF) under one or more
  2. # contributor license agreements. See the NOTICE file distributed with
  3. # this work for additional information regarding copyright ownership.
  4. # The ASF licenses this file to You under the Apache License, Version 2.0
  5. # (the "License"); you may not use this file except in compliance with
  6. # the License. You may obtain a copy of the License at
  7. #
  8. # http://www.apache.org/licenses/LICENSE-2.0
  9. #
  10. # Unless required by applicable law or agreed to in writing, software
  11. # distributed under the License is distributed on an "AS IS" BASIS,
  12. # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  13. # See the License for the specific language governing permissions and
  14. # limitations under the License.
  15.  
  16. # included in all the hadoop scripts with source command
  17. # should not be executable directly
  18. # also should not be passed any arguments, since we need original $*
  19.  
  20. # Set Hadoop-specific environment variables here.
  21.  
  22. #Set path to where bin/hadoop is available
  23. export HADOOP_COMMON_HOME=/usr/local/hadoop-2.6.
  24.  
  25. #Set path to where hadoop-*-core.jar is available
  26. export HADOOP_MAPRED_HOME=/usr/local/hadoop-2.6.
  27.  
  28. #set the path to where bin/hbase is available
  29. export HBASE_HOME=/usr/local/hbase-1.4.
  30.  
  31. #Set the path to where bin/hive is available
  32. export HIVE_HOME=/usr/local/apache-hive-2.1.-bin
  33.  
  34. #Set the path for where zookeper config dir is
  35. export ZOOCFGDIR=/usr/local/zookeeper/conf

6.配置linux的环境变量

  1. cd
  2. vim .bash_profile

在结尾添加如下代码:

  1. #sqoop
  2. export SQOOP_HOME=/usr/local/sqoop-1.4..bin__hadoop-2.6./
  3. export PATH=$PATH:$SQOOP_HOME/bin

7.保存退出;时文件生效:

  1. source .bash_profile

8.测试与mysql的连接:

  1. cd /usr/local/sqoop-1.4..bin__hadoop-2.6.0/bin
    sqoop list-databases --connect jdbc:mysql://localhost:3306 --username root -P

输入密码后会显示具体的数据库列表

9.查看具体数据库中的 表信息:

  1. sqoop list-tables --connect jdbc:mysql://localhost:3306/db1 --username root -P

10.执行查询语句:

  1. sqoop -eval --connect jdbc:mysql://localhost:3306/db1 --username root -P --query "select * from a limit 5"

sqoop的安装的更多相关文章

  1. Hadoop 2.6.0-cdh5.4.0集群环境搭建和Apache-Hive、Sqoop的安装

    搭建此环境主要用来hadoop的学习,因此我们的操作直接在root用户下,不涉及HA. Software: Hadoop 2.6.0-cdh5.4.0 Apache-hive-2.1.0-bin Sq ...

  2. Hive/Hbase/Sqoop的安装教程

    Hive/Hbase/Sqoop的安装教程 HIVE INSTALL 1.下载安装包:https://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-2.3 ...

  3. Sqoop的安装及简单使用

    SQOOP是用于对数据进行导入导出的. (1)把MySQL.Oracle等数据库中的数据导入到HDFS.Hive.HBase中   (2)把HDFS.Hive.HBase中的数据导出到MySQL.Or ...

  4. Sqoop的安装配置及使用

    一.Sqoop基础:连接关系型数据库与Hadoop的桥梁 1.1 Sqoop的基本概念 Hadoop正成为企业用于大数据分析的最热门选择,但想将你的数据移植过去并不容易.Apache Sqoop正在加 ...

  5. Sqoop环境安装

    环境下载 首先将下载的 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz放到 /usr/hadoop/目录下(该目录可以自定义,一般为Hadoop集群安装目录),然 ...

  6. Sqoop的安装和验证

    Sqoop是一个用来完成Hadoop和关系型数据库中的数据相互转移的工具,它可以将关系型数据库中的数据导入到Hadoop的HDFS中,也可以将HDFS的数据导入到关系型数据库中. Kafka是一个开源 ...

  7. 【sqoop】安装配置测试sqoop1

    3.1.1 下载sqoop1:sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz 3.1.2 解压并查看目录: [hadoop@hadoop01 ~]$ tar -zxvf sq ...

  8. 大数据之路week07--day06 (Sqoop 的安装及配置)

    Sqoop 的安装配置比较简单. 提供安装需要的安装包和连接mysql的驱动的百度云链接: 链接:https://pan.baidu.com/s/1pdFj0u2lZVFasgoSyhz-yQ 提取码 ...

  9. Sqoop 之 安装

    Sqoop 之 安装 前言 安装 Sqoop 的前提是已经具备 Java 和 Hadoop 的环境. 一.下载并解压 1) 下载地址:http://mirrors.hust.edu.cn/apache ...

随机推荐

  1. jQuery-3.事件篇---自定义事件

    jQuery自定义事件之trigger事件 众所周知类似于mousedown.click.keydown等等这类型的事件都是浏览器提供的,通俗叫原生事件,这类型的事件是需要有交互行为才能被触发. 在j ...

  2. man vxfenadm

    man vxfenadmReformatting page. Please Wait... done VCS 6.0.1 VXFENADM(1M) NAME vxfenadm - Manage SCS ...

  3. timestamp时间格式

    时间戳(timestamp),通常是一个字符序列,唯一地标识某一刻的时间. 时间戳是指格林威治时间1970年01月01日00时00分00秒(北京时间1970年01月01日08时00分00秒)起至现在的 ...

  4. Python全站之路----常用模块----configparser模块

    config:配置    parser:解析 此模块用于生成和修改常见配置文档,当前模块的名称在 python 3.x 版本中变更为 configparser,在 python 2.x 里名字为 Co ...

  5. Ubuntu19.04配置SS+pac非全局代理

    1.先安装shadowsocks-qt5 sudo apt install shadowsocks-qt5 2.因为ss是sock5代理,而shell不支持socks5代理,只支持http/https ...

  6. pycharm的快捷键

    一.编辑(Editing) Ctrl+Space 基本的代码完成(类.方法.属性) Ctrl+Alt+Space 快速导入任意类 Ctrl+Shift+Enter 语句完成 Ctrl+P 参数信息(在 ...

  7. linux 终端颜色代码

    echo -e "\033[背景;字体颜色m 字符串\033[0m" eg : echo -e "\033[30m 黑色字 \033[0m"   字体颜色(30 ...

  8. Java技术学习之影响MySQL性能的配置参数

    本文将介绍MySQL参数的五大类设置,平时我们一般都很少碰它们,在进行MySQL性能调优和故障诊断时这些参数还是非常有用的. (一)连接连接通常来自Web服务器,下面列出了一些与连接有关的参数,以及该 ...

  9. gitlab 添加 ssh

    git 客户端无法拉取gitlab仓库代码,登陆网页端,查看仓库主页有下面的提示 因此需要添加ssh公钥,才能上传下拉代码 windows平台: 首先需要安装git了. 在存放代码的目录中,右键选择 ...

  10. 华为4K机顶盒EC6108V9U从原联通更换为电信的IPTV账号成功经验

    4K设备直接在淘宝上买30块钱升级4K机顶盒,i视视手机app控制电视和手机投屏 硬件设备:EC6108V9U由X省联通更换为四川电信 采坑经验: 1.要从现有的机顶盒获取mac地址.stbid.ip ...