在Azkaban中,一个project包含一个或多个flows,一个flow包含多个job.job是你想在azkaban中运行的一个进程,可以是Command,也可以是一个Hadoop任务.当然,如果你安装相关插件,也可以运行插件.一个job可以依赖于另一个job,这种多个job和它们的依赖组成的图表叫做flow.本文介绍如何在Azkaban上编写四类任务流:Command.Hive.Java.Hadoop. 1.Command任务编写 这里将模拟一个数据从采集到上传最后入库的整个过程的工作流.…