一、经典MapReduce的作业运行机制

如下图是经典MapReduce作业的工作原理：

1.1 经典MapReduce作业的实体

经典MapReduce作业运行过程包含的实体：

客户端，提交MapReduce作业。
JobTracker，协调作业的运行。JobTracker是一个Java应用程序，它的主类是JobTracker。
TaskTracker，运行作业划分后的任务。TaskTracker是Java应用程序，它的主类是TaskTracker。
分布式文件系统（一般为HDFS），用来在其他实体间共享作业文件。

1.2 经典MapReduce作业的运行过程

1. 作业提交

客户端运行MapReduce作业（步骤1）
向JobTracker请求一个新的作业ID，通过调用JobTracker的getNewJobId()方法获取（步骤2）
将运行作业所需的资源（包括作业JAR文件、配置文件和计算所得的输入分片）复制到一个以ID命名的JobTracker的文件系统中（步骤3）
告知JobTracker作业准备执行，通过调用JobTracker的submitJob()方法实现（步骤4）

2. 作业初始化

JobTracker收到对其submitJob()方法的调用后，会把此调用放入一个内部队列中，交由作业调度器进行调度，并对其进行初始化（步骤5）。初始化包括创建一个表示正在运行作业的对象，用于封装任务和记录信息，以便跟踪任务的状态和进程。
作业调度器从共享文件系统中获取客户端已经计算好的输入分片（步骤6）。为每个分片创建一个map任务，创建的reduce任务由Job的mapred.reduce.tasks属性决定，以及新建作业创建和作业清理的任务。

3. 任务分配

TaskTracker定期向JobTracker发生“心跳（heartbeat）”，表名TaskTracker是否存活，同时保持两者之间的通信（步骤7）
JobTracker为TaskTracker分配任务，对于map任务，jobtracker会考虑tasktracker的网络位置，选取一个距离其输入分片文件最近的tasktracker，对于reduce任务，jobtracker会从reduce任务列表中选取下一个来执行。

4. 任务执行

从HDFS中把作业的JAR文件复制到TaskTracker所在的文件系统，实现JAR文件本地化，同时，TaskTracker将应用程序所需的全部文件从分布式缓存复制到本地磁盘（步骤8），并且为任务新建一个本地工作目录，把JAR文件中的内容解压到这个文件夹下，然后新建一个TaskRunner实例运行该任务。

5. 进度和状态更新

任务在运行时，对其进度（progress，即任务完成百分比）的保持跟踪。

6. 作业完成

将作业的状态设置为“成功”，并且清空JobTracker作业的工作状态，也指示TaskTracker清空作业的工作状态（如删除中间输出）。

二、Yarn上MapReduce作业运行机制

如图为Yarn中MapReduce作业的工作原理：

2.1 Yarn上的MapReduce作业的实体

主要包括以下几个实体：

提交MapReduce作业的客户端
ResourceManager，Yarn资源管理器，负责协调集群上计算资源的分配
NodeManager，Yarn节点管理器，负责启动和监视集群中机器上的计算容器（container）
MRAPPMaster，MapReduce应用程序MRAppMaster负责协调运行MapReduce作业的任务。它和MapReduce任务在容器中运行，这些容器由资源管理器分配并由节点管理器进行管理
分布式文件系统，一般为HDFS，用来与其他实体间共享作业文件

2.2 Yarn中MapReduce作业的运行过程

1. 作业提交

客户端运行MapReduce作业（步骤1）
客户端向ResourceManager请求新的作业ID，ResourceManager收到请求后，返回一个ApplicationID（步骤2）
客户端检查作业的的输出说明，计算输入分片，并将作业运行所需的资源（包括作业jar文件、配置文件和分片信息）复制到HDFS（步骤3）
告知ResourceManager作业准备执行，并调用ResourceManager上的submitApplication( )方法提交作业（步骤4）

2. 作业初始化

资源管理器收到应用提交请求后，便将请求传递给调度器Scheduler，调度器分配一个容器，然后ResourceManager在NodeManager的管理下在容器中启动应用程序的master进程（步骤5(a)和5(b)）
对作业进行初始化，创建对象以保持对作业进度的跟踪（步骤6）
MRAppMaster接受来自共享文件系统HDFS的在客户端计算的输入分片（步骤7）

3. 任务分配

MRAppMaster为作业中的所有map任务和reduce任务向ResourceManager请求容器（步骤8）

4. 任务执行

一旦ResourceManager的调度器为任务分配了容器，MRAppMaster就通过与NodeManager通信来启动容器（步骤9(a)和9(b)）
任务在运行之前，需要将任务所需的资源本地化，包括作业的配置、JAR文件和所有来自分布式缓存的文件（步骤10）
运行map任务或reduce任务（步骤11）

5. 进度和状态更新

任务每三秒钟通过umbilical接口向ApplicationMaster汇报自己的进度和状态（包含计数器），方便ApplicationMaster随时掌握各个任务的运行状态。

6. 作业完成

作业完成后，ApplicationMaster和任务容器清理其工作状态，ApplicationMaster向ResourceManager注销并关闭自己。

【参考链接】

[1] Asu_PC, MR1和MR2的工作原理.

[2] Tom Wbite, 《Hadoop权威指南》

经典MapReduce作业和Yarn上MapReduce作业运行机制的更多相关文章

MapReduce框架在Yarn上的具体解释
MapReduce任务解析在YARN上一个MapReduce任务叫做一个Job. 一个Job的主程序在MapReduce框架上实现的应用名称叫MRAppMaster. MapReduce任务的Tim ...
第2节 mapreduce深入学习：11、maptask运行机制（多看几遍）
mapTask运行机制详解以及mapTask的并行度在mapTask当中,一个文件的切片大小使用默认值是128M,就是跟我们一个block块对应大小一样 MapTask运行的整个过程背下来1.Tex ...
第2节 mapreduce深入学习：12、reducetask运行机制（多看几遍）
ReduceTask的运行的整个过程背下来1.启动线程到mapTask那里去拷贝数据,拉取属于每一个reducetask自己内部的数据2.数据的合并,拉取过来的数据进行合并,合并的过程,有可能在内存 ...
Yarn源码分析之MRAppMaster上MapReduce作业处理总流程（一）
我们知道,如果想要在Yarn上运行MapReduce作业,仅需实现一个ApplicationMaster组件即可,而MRAppMaster正是MapReduce在Yarn上ApplicationMas ...
Hadoop学习笔记（四）：Yarn和MapReduce
1. 先关闭掉所有的防火墙(master和所有slave) 2. 配置yarn-site.xml文件(配置所有机器,此时没有启动hadoop服务) 3. 启Yarn,输入要命令start-yarn.s ...
Yarn上运行spark-1.6.0
目录目录 1 1. 约定 1 2. 安装Scala 1 2.1. 下载 2 2.2. 安装 2 2.3. 设置环境变量 2 3. 安装Spark 2 3.1. 下载 2 3.2. 安装 2 3.3. ...
运行在YARN上的MapReduce应用程序（以MapReduce为例）
client作用:提交一个应用程序查看一个应用程序的运行状态(通过application master) 第一步:提交MR程序到ResourceManager,ResourceManager为这个应用 ...
大数据技术 - MapReduce 作业的运行机制
前几章我们介绍了 Hadoop 的 MapReduce 和 HDFS 两大组件,内容比较基础,看完后可以写简单的 MR 应用程序,也能够用命令行或 Java API 操作 HDFS.但要对 Hadoo ...
Yarn源码分析之MRAppMaster上MapReduce作业处理总流程（二）
本文继<Yarn源码分析之MRAppMaster上MapReduce作业处理总流程(一)>,接着讲述MapReduce作业在MRAppMaster上处理总流程,继上篇讲到作业初始化之后的作 ...

随机推荐

jenkins 配置主从机制（master-slaver）
1. 中文:系统管理——节点管理——新建节点(左上侧) 英文:Manage Jenkins——Manage Node——新建节点(左上侧) 2. 中文配图英文配图: 3. 远程工作目录以mac为例 ...
[转载]springboot--常用注解--@configration、@Bean
springboot--常用注解--@configration.@Bean @Target({ElementType.TYPE}) @Retention(RetentionPolicy.RUNTIME ...
flutter flutter_cupertino_date_picker 时间插件的用法
https://blog.csdn.net/sinat_37255207/article/details/100041023 https://github.com/wuzhendev/flutter- ...
简单理解yii事件
https://blog.csdn.net/qq43599939/article/details/80363827 通过观察者来理解yii事件测试 class TestController ext ...
Luogu P2824 [HEOI2016/TJOI2016]排序线段树+脑子
只会两个$log$的$qwq$ 我们二分答案:设答案为$ans$,则我们把$a[i]<=ans$全部设成$0$,把$a[i]>ans$全部设成$1$,扔到线段树里,这样区间排序(升序)就是 ...
ec20 queclocator V1. 0 test
AT+QICSGP=1,1,"UNIWAP","","",1 AT+QIACT=1 AT+QLOCCFG="contextid&q ...
Codevs 1137 计算系数 2011年NOIP全国联赛提高组
1137 计算系数 2011年NOIP全国联赛提高组时间限制: 1 s 空间限制: 128000 KB 题目等级 : 黄金 Gold 题目描述 Description 给定一个多项式(ax + by ...
Android项目实战登录&注册
由于项目中大部分界面都有一个后退键和一个标题栏,为避免代码冗杂以及便于利用,我们可以将后推荐和标题栏单独抽取出来定义一个标题栏布局,在 res/layout 目录下新建一个 Layout resour ...
shell 读取文本并访问mysql/redis
#!/bin/bash File="redeemcode.csv" #File=$ database="d_redeem_info" echo "ch ...
关于Math.random()
关于 Math.random() ,以前经常搞混淆,这次写个笔记专门记录下: Math.random() : 返回的是 0~1 之间的一个随机小数0<=r<1,即[0,1); 注意:这里 ...

经典MapReduce作业和Yarn上MapReduce作业运行机制