mapreduce job提交流程源码级分析（三）

　　mapreduce job提交流程源码级分析（二）（原创）这篇文章说到了jobSubmitClient.submitJob(jobId, submitJobDir.toString(), jobCopy.getCredentials())提交job，最终调用的是JobTracker.submitJob；而这篇文章JobTracker启动流程源码级分析则是分析的JobTracker的启动过程，JobTracker启动之后就会等待提交作业管理作业等。

　　接下来看看JobTracker.submitJob方法，调用这个方法之前已经将相关的资源分片信息、配置信息、外部文件、第三方jar包、一些归档文件以及job.jar上传到HDFS中了。

  public JobStatus submitJob(JobID jobId, String jobSubmitDir, Credentials ts)

       throws IOException {

     JobInfo jobInfo = null;

     UserGroupInformation ugi = UserGroupInformation.getCurrentUser();

     synchronized (this) {

       if (jobs.containsKey(jobId)) {

         // job already running, don't start twice

         return jobs.get(jobId).getStatus();

       }

       jobInfo = new JobInfo(jobId, new Text(ugi.getShortUserName()),

           new Path(jobSubmitDir));

     }

     // Create the JobInProgress, do not lock the JobTracker since

     // we are about to copy job.xml from HDFS

     //当JobTracker接收到新的job请求（即submitJob()函数被调用）后，

     //会创建一个JobInProgress对象并通过它来管理和调度任务。

     //JobInProgress在创建的时候会初始化一系列与任务有关的参数，调用到FileSystem，

     //把在JobClient端上传的所有任务文件下载到本地的文件系统中的临时目录里。这其中包括上传的*.jar文件包、

     //记录配置信息的xml、记录分割信息的文件。

     JobInProgress job = null;

     try {

       job = new JobInProgress(this, this.conf, jobInfo, 0, ts);

     } catch (Exception e) {

       throw new IOException(e);

     }

     synchronized (this) {

       // check if queue is RUNNING

       String queue = job.getProfile().getQueueName();

       if (!queueManager.isRunning(queue)) {

         throw new IOException("Queue \"" + queue + "\" is not running");

       }

       try {

         aclsManager.checkAccess(job, ugi, Operation.SUBMIT_JOB);

       } catch (IOException ioe) {

         LOG.warn("Access denied for user " + job.getJobConf().getUser()

             + ". Ignoring job " + jobId, ioe);

         job.fail();

         throw ioe;

       }

       // Check the job if it cannot run in the cluster because of invalid memory

       // requirements.

       try {

         checkMemoryRequirements(job);

       } catch (IOException ioe) {

         throw ioe;

       }

       boolean recovered = true; // TODO: Once the Job recovery code is there,

       // (MAPREDUCE-873) we

       // must pass the "recovered" flag accurately.

       // This is handled in the trunk/0.22

       if (!recovered) {

         // Store the information in a file so that the job can be recovered

         // later (if at all)

         Path jobDir = getSystemDirectoryForJob(jobId);

         FileSystem.mkdirs(fs, jobDir, new FsPermission(SYSTEM_DIR_PERMISSION));

         FSDataOutputStream out = fs.create(getSystemFileForJob(jobId));

         jobInfo.write(out);

         out.close();

       }

       // Submit the job

       JobStatus status;

       try {

         status = addJob(jobId, job);

       } catch (IOException ioe) {

         LOG.info("Job " + jobId + " submission failed!", ioe);

         status = job.getStatus();

         status.setFailureInfo(StringUtils.stringifyException(ioe));

         failJob(job);

         throw ioe;

       }

       return status;

     }

   }

　　一、首先看看jobs中有无要提交的Job，jobs是一个Map<JobID, JobInProgress> 这里存储着所有已知的Job及其对应的JobInProgress信息。如果已经存在这个Job则直接返回这个Job的状态；如果不存在则利用JobID和jobSubmitDir构造一个JobInfo对象，JobInfo类实现了Writable可以被序列化，而且存储三个字段JobID、user、以及上传资源的目录jobSubmitDir；

　　二、创建一个JobInProgress对象，JobInProgress类主要用于监控和跟踪作业运行状态，存在于作业的整个运行过程中，并为调度器提供最底层的调度接口，维护了两部分信息：一种是静态信息这些在作业提交之时就确定好了；另一种是动态的会随着作业的运行而动态变化的。job = new JobInProgress(this, this.conf, jobInfo, 0, ts)，这里会创建一个JobProfile一直跟踪作业的运行，不管作业作业活着还是死了；

　　三、checkMemoryRequirements(job)检查Job是否有无效的内存需求而不能运行，检查JobTracker的配置有无问题，再检查Job的内存配置有无问题；

　　四、是否存储作业信息以备恢复。在1.0.0版本中这还没实现(在这就是没存储信息)，要存的信息是一个JobInfo对象存储着作业的存储目录、ID以及user。

　　五、status = addJob(jobId, job)这是核心的提交方法。会将此Job放入jobs中，jobs保存着JobTracker所有运行作业的对应关系<jobID，JobInProgress>；然后让所有的JobInProgressListener监听这个Job，根据JobTracker启动流程源码级分析中可以知道这些JobInProgressListener实例都是通过调度器初始化(JobQueueTaskScheduler.start()方法)时，有俩线程一个是监控Job生命周期的，一个是对新加入的Job初始化的；一个监控Job的整个生命周期；然后加入监控统计中，返回job状态job.getStatus()。

　　这样Job的提交过程就完了，剩下的就是作业的调度分配及监控了。后续再讲吧

参考：

　　董西成，《Hadoop技术内幕：深入解析MapReduce架构设计与实现原理》

mapreduce job提交流程源码级分析（三）的更多相关文章

mapreduce job提交流程源码级分析（一）（原创）
首先,在自己写的MR程序中通过org.apache.hadoop.mapreduce.Job来创建Job.配置好之后通过waitForCompletion方法来提交Job并打印MR执行过程的log.H ...
mapreduce job提交流程源码级分析（二）（原创）
上一小节(http://www.cnblogs.com/lxf20061900/p/3643581.html)讲到Job. submit()方法中的: info = jobClient.submitJ ...
MapReduce之Job提交流程源码和切片源码分析
hadoop2.7.2 MapReduce Job提交源码及切片源码分析首先从waitForCompletion函数进入 boolean result = job.waitForCompletion ...
Spark3.0YarnCluster模式任务提交流程源码分析
1.通过spark-submit脚本提交spark程序在spark-submit脚本里面执行了SparkSubmit类的main方法 2.运行SparkSubmit类的main方法 3.调用doSu ...
JobTracker启动流程源码级分析
org.apache.hadoop.mapred.JobTracker类是个独立的进程,有自己的main函数.JobTracker是在网络环境中提交及运行MR任务的核心位置. main方法主要代码有两 ...
TaskTracker启动过程源码级分析
TaskTracker也是作为一个单独的JVM来运行的,其main函数就是TaskTracker的入口函数,当运行start-all.sh时,脚本就是通过SSH运行该函数来启动TaskTracker的 ...
MapReduce的MapTask任务的运行源码级分析
TaskTracker任务初始化及启动task源码级分析这篇文章中分析了任务的启动,每个task都会使用一个进程占用一个JVM来执行,org.apache.hadoop.mapred.Child方法 ...
MapReduce job在JobTracker初始化源码级分析
mapreduce job提交流程源码级分析(三)中已经说明用户最终调用JobTracker.submitJob方法来向JobTracker提交作业.而这个方法的核心提交方法是JobTracker.a ...
监听器初始化Job、JobTracker相应TaskTracker心跳、调度器分配task源码级分析
JobTracker和TaskTracker分别启动之后(JobTracker启动流程源码级分析,TaskTracker启动过程源码级分析),taskTracker会通过心跳与JobTracker通信 ...

随机推荐

C++中的虚函数与纯虚函数
这个吧,我也不怎么知道,所以,大家来看这两篇文章哦: http://blog.csdn.net/hackbuteer1/article/details/7558868 http://blog.csdn ...
JAVASCRIPT事件详解-------原生事件基础....
javaScirpt事件详解-原生事件基础(一) 事件 JavaScript与HTML之间的交互是通过事件实现的.事件,就是文档或浏览器窗口中发生的一些特定的交互瞬间,通过监听特定事件的发生,你能 ...
md5加密过程
import java.beans.Encoder; import java.security.MessageDigest; import java.security.NoSuchAlgorithmE ...
android fragment 博客学习记录
转载请标明出处:http://blog.csdn.net/lmj623565791/article/details/37992017 上篇博客中已经介绍了Fragment产生原因,以及一些基本的用法和 ...
ios app 支持 ipv6-only
最近苹果公司发布声明:自今年6月1日开始,所有提交至苹果App Store的应用申请必须要兼容面向硬件识别和网络路由的最新互联网协议--IPv6-only标准. 那么问题来了,目前的app是否支持ip ...
Now直播应用的后台服务器性能测试实践
版权声明:本文由Oliver原创文章,转载请注明出处: 文章原文链接:https://www.qcloud.com/community/article/208 来源:腾云阁 https://www.q ...
简单的Hibernate入门简介
其实Hibernate本身是个独立的框架,它不需要任何web server或application server的支持.然而,大多数的Hibernate入门介绍都加入了很多非Hibernate的东西, ...
JavaScript 3D图表
在说3D图表以前,首先要明确两个概念,一个是数据的维度,一个是呈现数据载体的维度.对于数据的维度,一维的数据呈现,但是呈现的载体是二维的平面图,比如饼图: 已经能够很清晰地观察到数据的分布情况.数据如 ...
求平均排序MATLAB code
A0=R(:,1:2:end); for i=1:17 A1=A0(i,:); p=sort(unique(A1)); for j=1:length(p) Rank0(A1==p(j))=j; end ...
SVMtoy
SVMtoy [label_matrix, instance_matrix] = libsvmread('ex8b.txt'); options = ''; % contour_level = [-1 ...

mapreduce job提交流程源码级分析（三）

mapreduce job提交流程源码级分析（三）的更多相关文章

随机推荐

热门专题