Spark-源码-TaskScheduler初始化过程, ClientActor向Master发送注册任务信息过程

Spark版本 1.3

Spark源码 Spark.createTaskScheduler TaskScheduler初始化过程

1.// SparkContext中

/**

 * Create a task scheduler based on a given master URL.

 * Return a 2-tuple of the scheduler backend and the task scheduler.

 */

private def createTaskScheduler(

      sc: SparkContext,

      master: String): (SchedulerBackend, TaskScheduler) = {

	// Regular expression used for local[N] and local[*] master formats

	// 一些关于模式的变量 这里只列举一个 (local[N] and local[*]);

	// 其他的还有 local[N, maxRetries], a Spark cluster of [N, cores, memory] locally,

	// Spark deploy clusters, Mesos cluster, Simr cluster

    val LOCAL_N_REGEX = """local\[([0-9]+|\*)\]""".r

    // When running locally, don't try to re-execute tasks on failure.

    // 他说本地模式下当任务失败的时候, 不会重试运行任务...

    val MAX_LOCAL_TASK_FAILURES = 1

    master match {

    	case "local" =>

    		...

    	// spark的StandAlone模式

      	case SPARK_REGEX(sparkUrl) =>

	        // 创建了一个TaskSchedulerImpl

	        val scheduler = new TaskSchedulerImpl(sc)

	        val masterUrls = sparkUrl.split(",").map("spark://" + _)

	        // 创建了一个SparkDeploySchedulerBackend, 他到底是怎么创建的? 详见下文 1.1

	        val backend = new SparkDeploySchedulerBackend(scheduler, sc, masterUrls)

	        // 调用initialize创建调度器 相见下文 1.2

	        // 下文会查看initialize方法~, 了解TaskScheduler的初始化过程

	        scheduler.initialize(backend)

	        (backend, scheduler)

	    case LOCAL_CLUSTER_REGEX(numSlaves, coresPerSlave, memoryPerSlave) =>

	    	...

    }

}

1.1 val backend = new SparkDeploySchedulerBackend(scheduler, sc, masterUrls)

class SparkDeploySchedulerBackend(

    scheduler: TaskSchedulerImpl,

    sc: SparkContext,

    masters: Array[String])

  extends CoarseGrainedSchedulerBackend(scheduler, sc.env.actorSystem)	//注意这里传入了一个ActorSystem

  with AppClientListener

  with Logging {

	...

	override def start() {

	// 首先调用父类的start方法来创建DriverActor

	// 用于和Executor通信, 将任务发送给Executor

	// 详见下文 1.1.1

	super.start()

	// 准备一些参数，以后把这些参数封装到一个对象中，然后将该对象发送给Master

	val driverUrl ...

	// 重要: CoarseGrainedExecutorBackend 这个参数是以后Executor的实现类

	// 把任务信息参数封装到 Command

    val command = Command("org.apache.spark.executor.CoarseGrainedExecutorBackend",

    	args, sc.executorEnvs, classPathEntries ++ testingClassPath, libraryPathEntries, javaOpts)

    // 最终的封装: 把command 和 任务资源信息 封装到ApplicationDescriptionval

    val appDesc = new ApplicationDescription(sc.appName, maxCores, sc.executorMemory, command,

    	appUIAddress, sc.eventLogDir, sc.eventLogCodec)

    // 创建一个AppClient, 把ApplicationDescription通过主构造器传进去

    client = new AppClient(sc.env.actorSystem, masters, appDesc, this, conf)

    // 然后调用AppClient的start方法，在start方法中创建了一个ClientActor

    // 其中像Master和Worker的actor一样需要preStart像Master注册

    // 其用于与Master通信, 用来发送任务信息 详见下文 1.1.2

    client.start()

    ...

}

1.1.1 super.start()

// 调用的是 CoarseGrainedSchedulerBackend.start (粗粒度调度程序后端器)

class CoarseGrainedSchedulerBackend(scheduler: TaskSchedulerImpl, val actorSystem: ActorSystem)

  extends ExecutorAllocationClient with SchedulerBackend with Logging{

  	...

	override def start() {

	    ...

	    // (prashant) send conf instead of properties

	    // 通过创建本粗粒度调度程序后端器时传入的ActorSystem, 在Driver端创建DriverActor

	    // 其用来和Excutor交互, 将任务发送给Executor

	    driverActor = actorSystem.actorOf(

	      Props(new DriverActor(properties)), name = CoarseGrainedSchedulerBackend.ACTOR_NAME)

	}

	...

}

// TaskScheduler的初始化过程, 在TaskSchedulerImpl中他的简介是这么写的 												

											Spark-源码-TaskScheduler初始化过程, ClientActor向Master发送注册任务信息过程的更多相关文章	

								Spark源码剖析（五）：Master原理与源码剖析（下）
		一. 状态改变机制源码分析 在剖析Master核心的资源调度算法之前,让我们先来看看Master的状态改变机制. Driver状态改变  可以看出,一旦Driver状态发生改变,基本没有好事情,后果要 ...
		
						Spark源码分析 – SchedulerBackend
		SchedulerBackend, 两个任务, 申请资源和task执行和管理 对于SparkDeploySchedulerBackend, 基于actor模式, 主要就是启动和管理两个actor De ...
		
						spark 源码分析之四 -- TaskScheduler的创建和启动过程
		在 spark 源码分析之二 -- SparkContext 的初始化过程 中,第 14 步 和 16 步分别描述了 TaskScheduler的 初始化 和 启动过程. 话分两头,先说 TaskSc ...
		
						Spark源码分析（一）-Standalone启动过程
		原创文章,转载请注明: 转载自http://www.cnblogs.com/tovin/p/3858065.html 为了更深入的了解spark,现开始对spark源码进行分析,本系列文章以spark ...
		
						Spark 源码解析：TaskScheduler的任务提交和task最佳位置算法
		上篇文章<  Spark 源码解析 : DAGScheduler中的DAG划分与提交 >介绍了DAGScheduler的Stage划分算法. 本文继续分析Stage被封装成TaskSet, ...
		
						spark源码阅读--SparkContext启动过程
		##SparkContext启动过程 基于spark 2.1.0  scala 2.11.8 spark源码的体系结构实在是很庞大,从使用spark-submit脚本提交任务,到向yarn申请容器,启 ...
		
						Spark源码系列（一）spark-submit提交作业过程
		前言 折腾了很久,终于开始学习Spark的源码了,第一篇我打算讲一下Spark作业的提交过程. 这个是Spark的App运行图,它通过一个Driver来和集群通信,集群负责作业的分配.今天我要讲的是如 ...
		
						Apache Spark源码走读之21 -- WEB UI和Metrics初始化及数据更新过程分析
		欢迎转载,转载请注明出处,徽沪一郎. 概要 WEB UI和Metrics子系统为外部观察监测Spark内部运行情况提供了必要的窗口,本文将简略的过一下其内部代码实现. WEB UI 先上图感受一下sp ...
		
						Spark源码分析（三）-TaskScheduler创建
		原创文章,转载请注明: 转载自http://www.cnblogs.com/tovin/p/3879151.html 在SparkContext创建过程中会调用createTaskScheduler函 ...
		
		
	

随机推荐	

									js 常用排序整理
			排序: 1. 内部排序: (1). 交换排序: 1). 冒泡排序 稳定 一次比较相邻两个元素的大小,顺序错误的,将其位置互换 (从高位到低位 或者 从低位到高位) 初始版: var array = [ ...
			
						blog test
			try my first blog by cnblog. i will record my learn experence in the future.
			
						Java框架安全
			(一)Mybatis注入问题 Mybatis是目前比较常用的ORM的框架,一般与SpringMVC框架整合较多,但使用不当会有SQL注入的风险. Mybatis里mapper中SQL语句的写法支持两种 ...
			
						mysql_01_游标的使用
			一.表的创建 1.直接创建表 DROP TABLE IF EXISTS shops_info; /*EMP产品版本版本信息表*/ CREATE TABLE shops_info ( ID INT PR ...
			
						再学UML-UML用例建模解析（三）
			2. 编写用例文档 绘制用例图只是完成了用例建模最基本也是最简单的一步,用例建模的核心在于编写用例文档,用例文档又称为用例规约或用例描述.顾名思义,用例文档是用于描述用例的文档,每一个用例对应于一个用 ...
			
						Qt 线程初识别
			Qt有两种多线程的方法,其中一种是继承QThread的run函数,另外一种是把一个继承于QObject的类转移到一个Thread里. 这里我使用的是继承的方法使用线程花一个"复杂" ...
			
						第3次Scrum冲刺
			*:first-child { margin-top: 0 !important; } body>*:last-child { margin-bottom: 0 !important; } /* ...
			
						SSM命名规范框架
			文件名 作用 src 根目录,没什么好说的,下面有main和test. main 主要目录,可以放java代码和一些资源文件. java 存放我们的java代码,这个文件夹要使用Build Path  ...
			
						Linq 集合比较
			List<RemindTbl> l_lstRemind = (from x in RemindTbl where (from y in RemindTblOld where x.Atten ...
			
						【洛谷P1272】 重建道路
			重建道路 题目链接 一场可怕的地震后,人们用N个牲口棚(1≤N≤150,编号1..N)重建了农夫John的牧场.由于人们没有时间建设多余的道路,所以现在从一个牲口棚到另一个牲口棚的道路是惟一的.因此, ...
Spark-源码-TaskScheduler初始化过程, ClientActor向Master发送注册任务信息过程

Spark-源码-TaskScheduler初始化过程, ClientActor向Master发送注册任务信息过程的更多相关文章

随机推荐

热门专题