在弄清楚yarn是什么之前,先来看一下MRv1. 它的由编程模型+数据处理引擎(map/reduceTask)+运行时环境组成(JobTracker/TaskTracker).其中JobTracker存在很多问题,如下: 1.JobTracker本身承担了调度和计算的任务,太累了 2.JobTracker是单点的,不好扩展不能支持其他计算框架,还有单点故障风险 3.资源是以槽位的方式来调度.粗粒度,不合理.比如提交了一个特别占用资源的任务,整个节点就被占用了.还有map阶段往往reduce槽位就…