设想一下,当你的系统引入了spark或者hadoop以后,基于Spark和Hadoop已经做了一些任务,比如一连串的Map Reduce任务,但是他们之间彼此右前后依赖的顺序,因此你必须要等一个任务执行成功后,再手动执行第二个任务.是不是很烦! 这个时候Oozie乌贼就派上用场了,它可以把多个任务组成一个工作流,自动完成任务的调用. 至于为什么要取这样的名字,我的理解是,乌贼有很多只脚但是只有一个身体,这正像是工作流引擎一样,功能很多,可以做的事情很多,但是都是受到一个调度器控制:它的身体很柔软…