说明:hadoop用的是hadoop-2.5.0-cdh5.3.6

Oozie用的是oozie-4.0.0-cdh5.3.6

该测试环境用户名为hadoop  主机名为hadoop01

2.4安装部署

(1)下载上传到目录: /opt/software/cdh-5.3.6

  一个安装包  一个ExtJS包用于提供Oozie界面

(2)解压到根目录的opt/cdh-5.3.6下面

[hadoop@hadoop01 cdh-5.3.6]$ tar -zxvf oozie-4.0.0-cdh5.3.6.tar.gz -C /opt/cdh-5.3.6/

(3)我们安装的是oozieserver

OOZIE_HOME不用设置,是自动配置的

(4)配置hadoop的代理

  利用nodepad++配置CDH版本的hadoop下面的配置文件core-site.xml

在core-site.xml配置两项

<!-- OOZIE   都修改为当前用户 此处为hadoop-->

<property>

<name>hadoop.proxyuser.hadoop.hosts</name>  【配置当前用户】

<value>*</value>   【oozie安装的主机名 *表示所有 为了便捷】

</property>

<property>

<name>hadoop.proxyuser.hadoop.groups</name> 【配置当前用户】

<value>*</value>   【配置ooize的同组用户  *表示所有 为了便捷】

</property>

【注意】

属性中的name标红的部分配置的是当前用户名,不是主机名,如果配置错误会报错;

org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.authorize.AuthorizationException): User: hadoop is not allowed to impersonate hadoop

获取用户名:

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$ whoami

Hadoop

获取主机名:

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$ hostname

hadoop01

(5)重启hadoop集群——有时间编写启动和关闭脚本

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$ pwd

/opt/cdh-5.3.6/hadoop-2.5.0-cdh5.3.6

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$ sbin/hadoop-daemon.sh stop namenode

stopping namenode

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$ sbin/hadoop-daemon.sh stop datanode

stopping datanode

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$ sbin/yarn-daemon.sh stop resourcemanager

stopping resourcemanager

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$ sbin/yarn-daemon.sh stop nodemanager

stopping nodemanager

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$ sbin/mr-jobhistory-daemon.sh stop historyserver

stopping historyserver

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$ jps

4169 Jps

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$ sbin/hadoop-daemon.sh start namenode

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$ sbin/hadoop-daemon.sh start datanode

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$ sbin/yarn-daemon.sh start resourcemanager

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$ sbin/yarn-daemon.sh start nodemanager

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$ sbin/mr-jobhistory-daemon.sh start historyserver

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$ jps

4199 NameNode

4286 DataNode

4375 ResourceManager

4792 JobHistoryServer

4632 NodeManager

4823 Jps

[hadoop@hadoop01 hadoop-2.5.0-cdh5.3.6]$

(6) 解压hadooplib 生成一个文件夹oozie-4.0.0-cdh

在oozie家目录下执行解压命令,该文件夹中包含了oozie使用需要的不同版本的hadoop的jar包

[hadoop@hadoop01 oozie-4.0.0-cdh5.3.6]$ tar -zxvf oozie-hadooplibs-4.0.0-cdh5.3.6.tar.gz

(7)在Oozie的home目录下创建libext文件夹

[hadoop@hadoop01 oozie-4.0.0-cdh5.3.6]$ mkdir libext

(8)拷贝hadooplib的jar包到libext中,注意是拷贝jar不是拷贝文件夹

[hadoop@hadoop01 oozie-4.0.0-cdh5.3.6]$

cp oozie-4.0.0-cdh5.3.6/hadooplibs/hadooplib-2.5.0-cdh5.3.6.oozie-4.0.0-cdh5.3.6/* libext/

(9)拷贝js包到libext中  注意:不用解压,拷贝zip包就可以了

[hadoop@hadoop01 oozie-4.0.0-cdh5.3.6]$ cp /opt/software/cdh-5.3.6/ext-2.2.zip libext/

查看是否有ext包

[hadoop@hadoop01 oozie-4.0.0-cdh5.3.6]$ ls libext/ |grep ext

(10)创建sharelib库:

理解:sharelib是创建在HDFS上面,用于运行所有job的依赖;Oozie上面大部分跑的是mapreduce任务,需要提供各种框架的jar包,而这些jar默认输入 输出的都是HDFS,所以需要这些依赖jar包。

[hadoop@hadoop01 oozie-4.0.0-cdh5.3.6]$ bin/oozie-setup.sh sharelib create -fs hdfs://hadoop01:8020 -locallib oozie-sharelib-4.0.0-cdh5.3.6-yarn.tar.gz

创建成功效果图如下

查看web端口

(11)打包

打包 war——封装所有的jar包, 时间可能较长

[hadoop@hadoop01 oozie-4.0.0-cdh5.3.6]$ bin/oozie-setup.sh prepare-war

成功后提示:

INFO: Oozie is ready to be started

(12)初始化数据库

[hadoop@hadoop01 oozie-4.0.0-cdh5.3.6]$ bin/ooziedb.sh create -sqlfile oozie.sql -run DB Connection

(13)启动oozie实例

[hadoop@hadoop01 oozie-4.0.0-cdh5.3.6]$ bin/oozied.sh start

注意:如果报pid文件存在导致不能启动  到路径下删除pid文件

(14)查看进程

(15)浏览器查看  端口为11000 http://hadoop01:11000/oozie/

Oozie_01安装教程【20161116】的更多相关文章

  1. Linux+apache+mono+asp.net安装教程

    Linux+apache+mono+asp.net安装教程(CentOS上测试的) 一.准备工作: 1.安装linux系统(CentOS,这个就不多讲了) 2.下载所需软件 http-2.4.4.ta ...

  2. Greenplum 源码安装教程 —— 以 CentOS 平台为例

    Greenplum 源码安装教程 作者:Arthur_Qin 禾众 Greenplum 主体以及orca ( 新一代优化器 ) 的代码以可以从 Github 上下载.如果不打算查看代码,想下载编译好的 ...

  3. git 安装教程

    昆,简单说下安装教程1,安装Git2,安装TortoiseGit3,打开第一步安装的git工具GIT BASH

  4. Docker和Docker-compose安装教程以及docker-elk,docker-storm安装教程

    此安装教程仅供我自己安装配置时查看,其他的人不可以偷看!!! 安装Docker 1. Update package information, ensure that APT works with th ...

  5. RHEL 6.3 详细安装教程

    以前刚接触linux时,什么都不懂,为了学习,在电脑上安装双系统(原系统为Win7),吃过不少苦头,在网上搜教程,很多都是语焉不详,导致安装过程中战战兢兢.最近朋友面试运维,面试官有考他对linux安 ...

  6. Android Studio的下载和安装教程(从ADT到AS)

    之前一直使用的是Android development tools(简称ADT),后来说是google对ADT不再提供支持,然后一直在考虑是否把自己电脑换成Android Studio(简称AS),从 ...

  7. mysql快速导出数据库ER图和数据字典(附navicat11安装教程及资源)

    ♣ mysql使用navicat11快速导出数据库ER图 ♣ mysql使用navicat11快速导出数据库数据字典 ♣ navicat11 for mysql (这里是mysql5.7.12)专业版 ...

  8. Smokeping安装教程

    Smokeping安装教程 #Smokeping2.6.8安装教程 #2016.3.6 改编v1.0 #Linux运维技术交流 347163978   环境 CentOS release 6.4 (F ...

  9. (二)ADS1.2的安装教程以及使用 调试 (不会 AXD 调试工具)

    安装教程: 参考百度 http://jingyan.baidu.com/article/cdddd41c7db85253cb00e1ae.html 具体使用看: 杨铸的那本书(嵌入式底层软件驱动开发) ...

随机推荐

  1. 数据挖掘-逻辑Logistic回归

    逻辑回归的基本过程:a建立回归或者分类模型--->b 建立代价函数 ---> c 优化方法迭代求出最优的模型参数  --->d 验证求解模型的好坏. 1.逻辑回归模型: 逻辑回归(L ...

  2. Jmeter之Constant Timer与constant throughput timer的区别

    当放置Constant Timer于两个http请求之间,那么它代表的含义是:在上一个请求发出至完成后, 开始Contant Timer指定的时间,最后再发出第二个请求.它并不是代表两个请求之间的发送 ...

  3. zw版【转发·台湾nvp系列Delphi例程】HALCON SetWindowExtent

    zw版[转发·台湾nvp系列Delphi例程]HALCON SetWindowExtent unit Unit1;interfaceuses Windows, Messages, SysUtils, ...

  4. uva11324 有向图的强连通分量+记忆化dp

    给一张有向图G, 求一个结点数最大的结点集,使得该结点集中任意两个结点u和v满足,要么u可以到达v, 要么v可以到达u(u和v相互可达也可以). 因为整张图可能存在环路,所以不好使用dp直接做,先采用 ...

  5. EF Code First 学习笔记:关系(转)

      一对多关系 项目中最常用到的就是一对多关系了.Code First对一对多关系也有着很好的支持.很多情况下我们都不需要特意的去配置,Code First就能通过一些引用属性.导航属性等检测到模型之 ...

  6. ng-深度学习-课程笔记-6: 建立你的机器学习应用(Week1)

    1 训练/验证/测试集( Train/Dev/test sets ) 构建神经网络的时候有些参数需要选择,比如层数,单元数,学习率,激活函数.这些参数可以通过在验证集上的表现好坏来进行选择. 前几年机 ...

  7. MFC中利用GDI+进行双缓冲作图的有关设置

    这里只是在遇到实际问题的时候提出的一种解决方法,用以处理闪屏问题. 首先要做的是对GDI的一个设置问题: 在应用程序类中添加一个保护权限数据成员 class C...App: {... private ...

  8. P3811 【模板】乘法逆元

    P3811 [模板]乘法逆元 线性递推逆元模板 #include<iostream> #include<cstdio> #include<cstring> #def ...

  9. 分布式缓存--系列1 -- Hash环/一致性Hash原理

    当前,Memcached.Redis这类分布式kv缓存已经非常普遍.从本篇开始,本系列将分析分布式缓存相关的原理.使用策略和最佳实践. 我们知道Memcached的分布式其实是一种“伪分布式”,也就是 ...

  10. lxml.etree去除子节点

    去除etree中的某个子节点有两种方法: 1.parentnode.remove(node) 2.etree.strip_elements(html, 'element_name', with_tag ...