Spark系列(八)Worker工作原理

工作原理图

源代码分析

包名：org.apache.spark.deploy.worker

启动driver入口点：registerWithMaster方法中的case LaunchDriver

1	) => DriverState.FINISHED
37	case _ => DriverState.FAILED
38	}
39	}
40
41	finalState = Some(state)
42	// 向Driver所属worker发送DriverStateChanged消息
43	worker ! DriverStateChanged(driverId, state, finalException)
44	}
45	}.start()
46	}

LaunchExecutor

管理LaunchExecutor的启动

1	case LaunchExecutor(masterUrl, appId, execId, appDesc, cores_, memory_) =>
2	if (masterUrl != activeMasterUrl) {
3	logWarning("Invalid Master (" + masterUrl + ") attempted to launch executor.")
4	} else {
5	try {
6	logInfo("Asked to launch executor %s/%d for %s".format(appId, execId, appDesc.name))
7
8	// Create the executor's working directory
9	// 创建executor本地工作目录
10	val executorDir = new File(workDir, appId + "/" + execId)
11	if (!executorDir.mkdirs()) {
12	throw new IOException("Failed to create directory " + executorDir)
13	}
14
15	// Create local dirs for the executor. These are passed to the executor via the
16	// SPARK_LOCAL_DIRS environment variable, and deleted by the Worker when the
17	// application finishes.
18	val appLocalDirs = appDirectories.get(appId).getOrElse {
19	Utils.getOrCreateLocalRootDirs(conf).map { dir =>
20	Utils.createDirectory(dir).getAbsolutePath()
21	}.toSeq
22	}
23	appDirectories(appId) = appLocalDirs
24	// 创建ExecutorRunner对象
25	val manager = new ExecutorRunner(
26	appId,
27	execId,
28	appDesc.copy(command = Worker.maybeUpdateSSLSettings(appDesc.command, conf)),
29	cores_,
30	memory_,
31	self,
32	workerId,
33	host,
34	webUi.boundPort,
35	publicAddress,
36	sparkHome,
37	executorDir,
38	akkaUrl,
39	conf,
40	appLocalDirs, ExecutorState.LOADING)
41	// executor加入本地缓存
42	executors(appId + "/" + execId) = manager
43	manager.start()
44	// 增加worker已使用core
45	coresUsed += cores_
46	// 增加worker已使用memory
47	memoryUsed += memory_
48	// 通知master发送ExecutorStateChanged消息
49	master ! ExecutorStateChanged(appId, execId, manager.state, None, None)
50	}
51	// 异常情况处理，通知master发送ExecutorStateChanged FAILED消息
52	catch {
53	case e: Exception => {
54	logError(s"Failed to launch executor $appId/$execId for ${appDesc.name}.", e)
55	if (executors.contains(appId + "/" + execId)) {
56	executors(appId + "/" + execId).kill()
57	executors -= appId + "/" + execId
58	}
59	master ! ExecutorStateChanged(appId, execId, ExecutorState.FAILED,
60	Some(e.toString), None)
61	}
62	}
63	}

总结

1、Worker、Driver、Application启动后都会向Master进行注册,并缓存到Master内存数据模型中
2、完成注册后发送LaunchExecutor、LaunchDriver到Worker
3、Worker收到消息后启动executor和driver进程，并调用Worker的ExecutorStateChanged和DriverStateChanged方法
4、发送ExecutorStateChanged和DriverStateChanged消息到Master的，根据各自的状态信息进行处理，最重要的是会调用schedule方法进行资源的重新调度

Spark系列(八)Worker工作原理的更多相关文章

Spark系列(十)TaskSchedule工作原理
工作原理图源码分析: 1.) 25 launchedTask = true 26 } 27 } catch { 28 ...
Spark系列(九)DAGScheduler工作原理
以wordcount为示例进行深入分析 1 33 ) { 46 logInfo("Submitting " + tasks.size + " missi ...
line-height系列——定义和工作原理总结
一.line-height的定义和工作原理总结 line-height的属性值: normal 默认设置合理的行间距. number 设置数字,此数字会与当前的字体尺寸相乘来设置行间距li ...
源码分析八( hashmap工作原理)
首先从一条简单的语句开始,创建了一个hashmap对象: Map<String,String> hashmap = new HashMap<String,String>(); ...
[Spark内核] 第32课：Spark Worker原理和源码剖析解密：Worker工作流程图、Worker启动Driver源码解密、Worker启动Executor源码解密等
本課主題 Spark Worker 原理 Worker 启动 Driver 源码鉴赏 Worker 启动 Executor 源码鉴赏 Worker 与 Master 的交互关系 [引言部份:你希望读者 ...
【原】Learning Spark (Python版) 学习笔记(三)----工作原理、调优与Spark SQL
周末的任务是更新Learning Spark系列第三篇,以为自己写不完了,但为了改正拖延症,还是得完成给自己定的任务啊 = =.这三章主要讲Spark的运行过程(本地+集群),性能调优以及Spark ...
How Javascript works (Javascript工作原理) (八) WebAssembly 对比 JavaScript 及其使用场景
个人总结: webworker有以下三种: Dedicated Workers 由主进程实例化并且只能与之进行通信 Shared Workers 可以被运行在同源的所有进程访问(不同的浏览的选项卡,内 ...
49、Spark Streaming基本工作原理
一.大数据实时计算介绍 1.概述 Spark Streaming,其实就是一种Spark提供的,对于大数据,进行实时计算的一种框架.它的底层,其实,也是基于我们之前讲解的Spark Core的. 基本 ...
46、Spark SQL工作原理剖析以及性能优化
一.工作原理剖析 1.图解二.性能优化 1.设置Shuffle过程中的并行度:spark.sql.shuffle.partitions(SQLContext.setConf()) 2.在Hive数据 ...

随机推荐

Arc Engiene读取文档的属性
设计界面创建类代码如下 using System; using System.Collections.Generic; using System.Linq; using System.Text; ...
ASP.NET获取路径的方法
原文:[转载]ASP.NET获取路径的方法 HttpContext.Current.Request.PhysicalPath; // 获得当前页面的完整物理路径.比如 F:\XFU.NSQS\p ...
MultiSelectListPreference 的使用心得
最近在学习Android上的开发,打算做一个app.在做之前感觉很简单的功能,自己也有几年的C++经验,应该学起来很容易.但是事实告诉我,要注意的细节还是很多的. 大部分的app都会有设置页面, 用来 ...
iOS 精确定时器
Do I need a high precision timer? Don't use a high precision timer unless you really need it. They c ...
makefile生成静态库和动态库
库是一种软件组件技术,库里面封装了数据和函数. 库的使用可以使程序模块化. Windows系统包括静态链接库(.lib文件)和动态链接库(.dll文件). Linux通常把库文件存放在/usr/lib ...
laravel url管理与使用
获取当前URL 获取当前URL有两种方式,URL::current()或URL::full(),区别是返不返回GET参数如 Route::get('/current/url',function() { ...
Struts2的简单案例
第一步:首先下载struts2的架包(链接地址:http://download.csdn.net/detail/ahy1024/4626028) 第二步:新建web project项目 DemoStr ...
ExtJs自学教程(2)：从DOM看EXTJS
<二> 从DOM看EXTJS 看标题可能有人会问,为啥好好的例子不看,得从DOM看起呢?答案是目标只为了一个:自运行结果把EXTJS看得更清楚点首先,要看得靠点工具,带点放大镜什么吧?对 ...
python学习，dict的映射练习
练习dict的映射 #coding:utf-8 #问题: a->c, b->d, c->e... 现在有结果字符串求原字符串 dict1={'a':'c', 'b':'d', 'c' ...
转：java提取图片中的像素
本文转自:http://www.infosys.tuwien.ac.at/teaching/courses/WebEngineering/References/java/docs/api/java/a ...

Spark系列(八)Worker工作原理

Spark系列(八)Worker工作原理的更多相关文章

随机推荐

热门专题