Azkaban(一)【集群安装】

一.下载解压
二. 配置Mysql
三. 配置Azkaban Executor
四. 配置Azkaban WebServer

一.下载解压

1.下载地址：https://github.com/azkaban/azkaban

2.上传tar包

1）将azkaban-db-3.84.4.tar.gz，azkaban-exec-server-3.84.4.tar.gz，azkaban-web-server-3.84.4.tar.gz上传到hadoop102的/opt/software路径

[hadoop@hadoop102 software]$ ll

总用量 35572

-rw-r--r--. 1 atguigu atguigu     6433 4月  18 17:24 azkaban-db-3.84.4.tar.gz

-rw-r--r--. 1 atguigu atguigu 16175002 4月  18 17:26 azkaban-exec-server-3.84.4.tar.gz

-rw-r--r--. 1 atguigu atguigu 20239974 4月  18 17:26 azkaban-web-server-3.84.4.tar.gz

2）新建/opt/module/azkaban目录，并将所有tar包解压到这个目录下

[hadoop@hadoop102 software]$ mkdir /opt/module/azkaban

3）解压azkaban-db-3.84.4.tar.gz、 azkaban-exec-server-3.84.4.tar.gz和azkaban-web-server-3.84.4.tar.gz到/opt/module/azkaban目录下

[hadoop@hadoop102 software]$ tar -zxvf azkaban-db-3.84.4.tar.gz -C /opt/module/azkaban/

[hadoop@hadoop102 software]$ tar -zxvf azkaban-exec-server-3.84.4.tar.gz -C /opt/module/azkaban/

[hadoop@hadoop102 software]$ tar -zxvf azkaban-web-server-3.84.4.tar.gz -C /opt/module/azkaban/

4）进入到/opt/module/azkaban目录，依次修改名称

[hadoop@hadoop102 azkaban]$ mv azkaban-exec-server-3.84.4/ azkaban-exec

[hadoop@hadoop102 azkaban]$ mv azkaban-web-server-3.84.4/ azkaban-web

二. 配置Mysql

1.正常安装MySQL

参考Hive(一)【基本概念、安装】中的Mysql安装

以下密码设置为000000

2.启动MySQL

[hadoop@hadoop102 azkaban]$ mysql -uroot -p000000

3.登陆MySQL，创建Azkaban数据库

mysql> create database azkaban;

4.创建azkaban用户并赋予权限

设置密码有效长度4位及以上

mysql> set global validate_password_length=4;

设置密码策略最低级别

mysql> set global validate_password_policy=0;

创建Azkaban用户，任何主机都可以访问Azkaban，密码是000000

mysql> CREATE USER 'azkaban'@'%' IDENTIFIED BY '000000';

赋予Azkaban用户增删改查权限

mysql> GRANT SELECT,INSERT,UPDATE,DELETE ON azkaban.* to 'azkaban'@'%' WITH GRANT OPTION;

赋予Azakban用户远程访问权限,密码是000000

mysql> grant all privileges on azkaban.* to 'azkaban'@'%'  identified by '000000' with grant option;

5.创建Azkaban表，完成后退出MySQL

mysql> use azkaban;

mysql> source /opt/module/azkaban/azkaban-db-3.84.4/create-all-sql-3.84.4.sql

mysql> quit;

6.更改MySQL包大小；防止Azkaban连接MySQL阻塞

[hadoop@hadoop102 software]$ sudo vim /etc/my.cnf

在[mysqld]下面加一行max_allowed_packet=1024M

[mysqld]

max_allowed_packet=1024M

8）重启MySQL

[atguigu@hadoop102 software]$ sudo systemctl restart mysqld

三. 配置Azkaban Executor

Azkaban Executor Server处理工作流和作业的实际执行。

1.编辑azkaban.properties

[hadoop@hadoop102 azkaban]$ vim /opt/module/azkaban/azkaban-exec/conf/azkaban.properties

修改如下属性

#修改和服务器时区一致

default.timezone.id=Asia/Shanghai

#Web服务器的地址

azkaban.webserver.url=http://hadoop102:8081

#端口

executor.port=12321

#注意改成自己的主机、用户、密码

database.type=mysql

mysql.port=3306

mysql.host=hadoop102

mysql.database=azkaban

mysql.user=azkaban

mysql.password=000000

mysql.numconnections=100

在最后添加

executor.metric.reports=true

executor.metric.milisecinterval.default=60000

2.同步azkaban-exec到所有节点

[hadoop@hadoop102 azkaban]$ xsync /opt/module/azkaban/azkaban-exec

3）必须进入到/opt/module/azkaban/azkaban-exec路径，分别在三台机器上，启动executor server

[hadoop@hadoop102 azkaban-exec]$ bin/start-exec.sh

[hadoop@hadoop103 azkaban-exec]$ bin/start-exec.sh

[hadoop@hadoop104 azkaban-exec]$ bin/start-exec.sh

注意：如果在/opt/module/azkaban/azkaban-exec目录下出现executor.port文件，说明启动成功，没有说明前面配置有问题。

4.激活executor

[hadoop@hadoop102 azkaban-exec]$ curl -G "hadoop102:$(<./executor.port)/executor?action=activate" && echo

[hadoop@hadoop103 azkaban-exec]$ curl -G "hadoop103:$(<./executor.port)/executor?action=activate" && echo

[hadoop@hadoop104 azkaban-exec]$ curl -G "hadoop104:$(<./executor.port)/executor?action=activate" && echo

如果三台机器都出现如下提示，则表示激活成功

{"status":"success"}

注意：每次启动都需要重新激活

四. 配置Azkaban WebServer

Azkaban Web Server处理项目管理，身份验证，计划和执行触发。

1.编辑azkaban.properties

[hadoop@hadoop102 azkaban]$ vim /opt/module/azkaban/azkaban-web/conf/azkaban.properties

修改如下属性，

...

#改时区

default.timezone.id=Asia/Shanghai

...

#自己的主机，用户，密码

database.type=mysql

mysql.port=3306

mysql.host=hadoop102

mysql.database=azkaban

mysql.user=azkaban

mysql.password=000000

mysql.numconnections=100

...

#只需要StaticRemainingFlowSize,CpuStatus

azkaban.executorselector.filters=StaticRemainingFlowSize,CpuStatus

说明

azkaban.executorselector.filters: 当有多个Executor同时启动的时候，需要从中选择一个Executor去执行任务，这里设置一组过滤器的种类，不满足要求的Executor就不会被分配任务

StaticRemainingFlowSize：正在排队的任务数；

CpuStatus：CPU占用情况

MinimumFreeMemory：内存占用情况。测试环境，必须将MinimumFreeMemory删除掉，否则它会认为集群资源不够，不执行。

2.修改azkaban-users.xml文件，添加atguigu用户

[hadoop@hadoop102 azkaban-web]$ vim /opt/module/azkaban/azkaban-web/conf/azkaban-users.xml

<azkaban-users>

  <user groups="azkaban" password="azkaban" roles="admin" username="azkaban"/>

  <user password="metrics" roles="metrics" username="metrics"/>

  <!--测试用户-->

  <user password="test" roles="metrics,admin" username="test"/>

  <role name="admin" permissions="ADMIN"/>

  <role name="metrics" permissions="METRICS"/>

</azkaban-users>

3.必须进入到hadoop102的/opt/module/azkaban/azkaban-web路径，启动web server

[hadoop@hadoop102 azkaban-web]$ bin/start-web.sh

4.访问http://hadoop102:8081,并用test用户登陆

出现以下页面说明安装成功。