下载

http://www-us.apache.org/dist/sqoop/ 
打开以上链接,开始下载sqoop2 
 
 
下载后得到:sqoop-1.99.7-bin-hadoop200.tar.gz文件

其中sqoop1和sqoop2区别可以参考以下链接 
重拾初心——Sqoop1和Sqoop2的刨析对比 
http://blog.csdn.net/gamer_gyt/article/details/55225700

安装

安装步骤参考官方文档 
http://sqoop.apache.org/docs/1.99.7/admin/Installation.html

解压tar包

将sqoop-1.99.7-bin-hadoop200.tar.gz上传至服务器中,这里安装到/usr/local/hadoop/sqoop-1.99.7目录中

  1. # 拷贝tar包到/usr/local/hadoop/中
  2. cp sqoop-1.99.7-bin-hadoop200.tar.gz /usr/local/hadoop/
  3. # 解压tar包
  4. tar -xvf sqoop-1.99.7-bin-hadoop200.tar.gz
  5. # 为文件夹重命名
  6. mv sqoop-1.99.7-bin-hadoop200 sqoop-1.99.7

配置sqoop2

  1. 确保sqoop2所依赖的环境变量 
    sqoop2需要hadoop的依赖(HADOOP_COMMON, HADOOP_HDFS, HADOOP_MAPRED, HADOOP_YARN),所以你的环境变量中需要存在如下的环境变量
  1. export HADOOP_HOME=/..

或者

  1. export HADOOP_COMMON_HOME=/...
  2. export HADOOP_HDFS_HOME=/...
  3. export HADOOP_MAPRED_HOME=/...
  4. export HADOOP_YARN_HOME=/...

如果配置了HADOOP_HOME,则sqoop会自动寻找$HADOOP_HOME/share/common相应的目录。

  1. 配置sqoop2的环境变量 
    在/etc/profire文件中增加如下配置,注意SQOOP2_HOME的位置
  1. #Sqoop配置
  2. export SQOOP2_HOME=/usr/local/hadoop/sqoop-1.99.7
  3. export CATALINA_BASE=$SQOOP2_HOME/server
  4. #Sqoop外部jar包存放路径,以后mysql-**.jar,odbc*.jar文件都放到extra-lib中即可
  5. export SQOOP_SERVER_EXTRA_LIB=$SQOOP2_HOME/server/lib/extra-lib
  6. export PATH=$PATH:$SQOOP2_HOME/bin
  1. sqoop访问hdfs的配置 
       因为sqoop访问Hadoop的MapReduce使用的是代理的方式,必须在Hadoop的core-site.xml中配置所接受的proxy用户和组,在hadoop的core-site.xml中增加如下配置,其中sqoop2是代理的用户和组的意思。表示运行hadoop的系统用户名
  1. <property>
  2. <name>hadoop.proxyuser.root.hosts</name>
  3. <value>*</value>
  4. </property>
  5. <property>
  6. <name>hadoop.proxyuser.root.groups</name>
  7. <value>*</value>
  8. </property>
  1. 配置sqoop访问的hadoop配置文件的位置 
    在/usr/local/hadoop/sqoop-1.99.7/conf/sqoop.properties文件中,修改如下变量的值为你hadoop配置文件目录 
  1. org.apache.sqoop.submission.engine.mapreduce.configuration.directory=/usr/local/hadoop/hadoop-2.7.4/etc/hadoop

初始化sqoop仓库

因为sqoop2中存储着元数据信息,所以首次安装时需要初始化仓库

  1. sqoop2-tool upgrade

初始化完成后,可以做一次验证

  1. sqoop2-tool verify

当出现Verification was successful.字样时,表示初始化成功。

启动sqoop

执行sqoop2-server start启动sqoop,同理。执行sqoop2-server stop会停止sqoop

  1. sqoop2-server start

执行完以上命令后,启动信息如下。 

然后执行jps命令查看启动了哪些进程,可以看到sqoop server只启动了SqoopJettyServer进程。 

启动sqoop客户端

由于我现在是伪分布式,所以sqoop server和sqoop client都在一台机器上,直接执行sqoop2-shell命令即可启动sqoop客户端 
 
可以查看sqoop2的版本,执行show version --all命令

  1. sqoop:000> show version --all
  2. client version:
  3. Sqoop1.99.7 source revision 435d5e61b922a32d7bce567fe5fb1a9c0d9b1bbb
  4. Compiledby abefine on TueJul1916:08:27 PDT 2016
  5. 0[main] WARN org.apache.hadoop.util.NativeCodeLoader-Unable to load native-hadoop library for your platform...using builtin-java classes where applicable
  6. server version:
  7. Sqoop1.99.7 source revision 435d5e61b922a32d7bce567fe5fb1a9c0d9b1bbb
  8. Compiledby abefine on TueJul1916:08:27 PDT 2016
  9. API versions:
  10. [v1]
  11. sqoop:000>

Sqoop2安装的更多相关文章

  1. sqoop2安装总结

    sqoop2安装 1. 下载解压缩 此次安装版本为1.99.6 # Decompress Sqoop distribution tarball tar -xvf sqoop-<version&g ...

  2. Sqoop2安装记录

    我是採用的源代码编译的包安装的, 主要是考虑到会对部分功能做裁剪或增强, 详细源代码编译方式能够參考另外一篇博文<编译Sqoop2错误解决>.然后从dist/target文件夹下拷贝sqo ...

  3. sqoop1.4.6+hadoop2.6.0 转载

    转载地址:http://blog.csdn.net/zhangzhaokun/article/details/44313531 (1)安装环境         操作系统:Linux(centos6.5 ...

  4. 北风风hadoop课程体系

    课程一.基于Linux操作系统平台下的Java语言开发(20课时)课程简介本套课程主要介绍了Linux系统下的Java环境搭建及最基础的Java语法知识.学习Linux操作系统下Java语言开发的好处 ...

  5. 基于Hadoop2.0、YARN技术的大数据高阶应用实战(Hadoop2.0\YARN\Ma

    Hadoop的前景 随着云计算.大数据迅速发展,亟需用hadoop解决大数据量高并发访问的瓶颈.谷歌.淘宝.百度.京东等底层都应用hadoop.越来越多的企 业急需引入hadoop技术人才.由于掌握H ...

  6. 最完整的历史记录hadoop

    课程主要涉及Hadoop Sqoop.Flume.Avro重要子项目的技术实战 课程针对人群 1.本课程适合于有一定java基础知识.对数据库和sql语句有一定了解,熟练使用linux系统的技术人员, ...

  7. sqoop2-1.99.5-cdh5.5.4.tar.gz的部署搭建

    不多说,直接上干货! 首先,说下博主我,为什么,好端端的Sqoop1用的好好的,然后又安装和学习Sqoop2? 因为,在Cloudera Hue里的Sqoop,是需要Sqoop2. HUE配置文件hu ...

  8. CentOS6.5安装sqoop2

    1.下载软件:http://archive.cloudera.com/cdh5/cdh/5/ 2.解压:tar -zxvf mysofts/sqoop2-1.99.5-cdh5.6.0.tar.gz ...

  9. sqoop2的安装配置

    1.下载 wget http://mirror.bit.edu.cn/apache/sqoop/1.99.7/sqoop-1.99.7-bin-hadoop200.tar.gz 2.解压 tar -z ...

随机推荐

  1. object Add(object Before, object After, object Count, object Type);

    [表达式] .Add(Before, After, Count, Type) [表达式] 一个代表 Sheets 对象的变量. Before指定工作表的对象,新建的工作表将置于此工作表之前. Afte ...

  2. 基础dp 记录

    51nod 1134 最长递增子序列 #include<iostream> #include<cstdio> #include<cstring> #include& ...

  3. BZOJ1632: [Usaco2007 Feb]Lilypad Pond SPFA+最短路计数

    Description 为了让奶牛们娱乐和锻炼,农夫约翰建造了一个美丽的池塘.这个长方形的池子被分成了M行N列个方格(1≤M,N≤30).一些格子是坚固得令人惊讶的莲花,还有一些格子是岩石,其余的只是 ...

  4. json获取元素数量

    var keleyijson={"plug1":"myslider","plug2":"zonemenu"} funct ...

  5. UVa 208 消防车(dfs+剪枝)

    https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem& ...

  6. LoadRunner测试流程

    使用LoadRunner 完成测试一般分为四个步骤: 2 Vvitrual User Generator 创建脚本 创建脚本,选择协议 录制脚本 编辑脚本 检查修改脚本是否有误 3 中央控制器(Con ...

  7. hdu 4521 小明系列问题——小明序列 线段树+二分

    小明系列问题——小明序列 Time Limit: 3000/1000 MS (Java/Others)    Memory Limit: 65535/32768 K (Java/Others) Pro ...

  8. python 时间元组转可视化时间

    >>> import time >>> time.asctime() 'Fri Jan 4 11:17:20 2019' >>> time.asc ...

  9. python datetime模块来获取当前的日期和时间

    #!/usr/bin/python # -*- coding: UTF- -*- import datetime i = datetime.datetime.now() print ("当前 ...

  10. DEV-C++设置C++11标准

    DEV-C++默认的标准是C++98,改成C++11的方法如下: Tools -> Compiler Options -> Setting -> Code Generation -& ...