Executor.scala

一、Executor类

首先判断本地性，获取slaves的host name（不是IP或者host: port），匹配运行环境为集群或者本地。如果不是本地执行，需要启动一个handler来监控所有的executor进程，避免阻塞。然后，初始化Spark执行环境。向SparkEnv注册executor资源，即registerSource方法。第三步，装载类，序列化类到内存中。第四，启动worker的线程池。第五，收集所有的task任务。接下就可以分配资源给task了，即将task与executor结合。

1、launchTask()：新建一个TaskRunner，对应的有task的信息；然后调用runningTasks的put方法装载该TaskRunner，并在线程池中执行该task。

2、killTask()：杀死指定线程。

3、releaseWriter()：获取ShuffleId，与BlockManager进行交互。具体作用？需要了解spark.shuffle.consolidatFiles的意义。

4、stop()：报告停止信息，关闭线程池。

二、TaskRunner类

继承自Runnable类，是task信息的容器。

1、kill()：由Executor杀死指定线程。

2、run()：重载的方法。执行task的进程，更改task的状态。同时启动GC机制，task的相关信息需要反序列化出来。run方法中需要保证task的epoch值与master一致，在MapOutPutTracker中体现，保证该任务可以被master管理。等任务执行完毕，分析任务执行的时间，序列化时间等等。然后对执行结果进行序列化处理，获取存储的block的Id并将序列化数据存入block。最后是复杂的异常处理。

3、CreateClassLoader()：为task建立的用来加载用户指定的jars或者任何需要用到的classes。首先检查是否是加载用户自定义的类，是则新建childExecutorURLClassLoader，否则新建ExecutorURLClassLoader，最终返回MutableURLClassLoader类型。

4、addReplClassLoaderInfNeeded()：家在一个新的ClassLoader来加载另一个jar。

5、updateDependencies()：根据SparkContext所提供的新文件或者新jars，装载未被加载的依赖包，同时加载这些所依赖的包到ClassLoader中。

6、startDriverHeartbeater()：启动心跳机制，将taskRunner的信息发送给master。

Spark源码学习1.6——Executor.scala的更多相关文章

Spark源码学习1.2——TaskSchedulerImpl.scala
许久没有写博客了,没有太多时间,最近陆续将Spark源码的一些阅读笔记传上,接下来要修改Spark源码了. 这个类继承于TaskScheduler类,重载了TaskScheduler中的大部分方法,是 ...
Spark源码学习1.1——DAGScheduler.scala
本文以Spark1.1.0版本为基础. 经过前一段时间的学习,基本上能够对Spark的工作流程有一个了解,但是具体的细节还是需要阅读源码,而且后续的科研过程中也肯定要修改源码的,所以最近开始Spark ...
Spark源码学习1.8——ShuffleBlockManager.scala
shuffleBlockManager继承于Logging,参数为blockManager和shuffleManager.shuffle文件有三个特性:shuffleId,整个shuffle stag ...
Spark源码学习1.3——TaskSetManager.scala
TaskSetManager.scala TaskSet是指一系列被提交的task,一般是代表特定的stage中丢失的partition.TaskSetManager通过一个TaskScheduler ...
Spark源码学习1.7——Master.scala
master第一步是加载系统定义的环境变量,如worker的超时时间.系统保留的Application数目等:第二步,加载worker的信息,地址.id等:第三步,加载Application的信息, ...
Spark源码学习1.5——BlockManager.scala
一.BlockResult类该类用来表示返回的匹配的block及其相关的参数.共有三个参数: data:Iterator [Any]. readMethod: DataReadMethod.Valu ...
Spark源码学习1.4——MapOutputTracker.scala
相关类:MapOutputTrackerMessage,GetMapOutputStatuses extends MapPutputTrackerMessage,StopMapOutputTracke ...
Spark源码学习2
转自:http://www.cnblogs.com/hseagle/p/3673123.html 在源码阅读时,需要重点把握以下两大主线. 静态view 即 RDD, transformation a ...
Spark源码学习3
转自:http://www.cnblogs.com/hseagle/p/3673132.html 一.概要本篇主要阐述在TaskRunner中执行的task其业务逻辑是如何被调用到的,另外试图讲清楚 ...

随机推荐

hive修改表/分区语句
参考 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-AlterTable% ...
T-SQL、JET SQL、PL-SQL
数据库分为网状.层状.关系.对象四种类型,目前的数据库一般都是属于关系数据库(包括MYSQL和SQL SERVER),网状.层状基本上已成历史,对象类型尚未普及. SQL 语言是有 ANSI 标准的. ...
LR录制Flex+Web，登录功能之登录密码出错的处理
在LR中录制好更改密码脚本,Controller中使用少量用户进行:单用户多迭代.多用户单迭代.多用户多迭代,运行正常,于是使用490Vuser+2iteration修改980个用户的密码,部分 Vu ...
Discuz论坛安全加固浅析
[51CTO专稿]Discuz! 论坛以其功能完善.效率高效.负载能力,深受被大多数的网站喜爱和青睐.无独有隅,笔者所维护的论坛就是用discuz! 来构建的,从接手时候的7.2到现在x2.0,经历了 ...
APACHE 在windows下的配置
目前apache在windows下只支持到2.2 所以php必须下载相应的线程安全的然后打开apache的配置页面 listen directory 和 load_module修改 httpd -k ...
Ajax&Java
AJAX即“Asynchronous Javascript And XML”(异步JavaScript和XML) 是一种基于浏览器的XMLHttpRequest对象实现的创建交互式网页应用的网页开发技 ...
MVC3 新建项目
一.安装工具二.新建项目 step1:新建MVC3项目打开新建项目窗口,在“已安装的模板”列表中选择“Web”,在右侧应用程序模板列表中选择“ASP.NET MVC3 Web应用程序”,修改项目名 ...
多行溢出隐藏显示省略号功能的JS实现
在页面重构中,经常需要将过多的内容隐藏而显示部分.在单行文本中实现非常简单,但是在多行文本中,则需要根据实际选择不同的方式. 用CSS实现多行溢出隐藏的代码非常简单,但是兼容性也相对较低. displ ...
WinForm 菜单和工具栏
菜单和工具栏: 1.MenuStrip:顶部菜单优先级最高,默认在最顶部 (1)分割线:a.打一个减号 “-” b.右键插入Separator (2)点击事件:每 ...
苹果下如果安装nginx,给nginx安装markdown第三方插件
用brew install nginx 这样安装的是最新版的nginx, 但是在有些情况下,安装第三方插件需要特定的版本,更高一级的版本可能装不上. 它的原理是下载安装包进行自动安装,建立软链,这样就 ...

Spark源码学习1.6——Executor.scala

Executor.scala

Spark源码学习1.6——Executor.scala的更多相关文章

随机推荐

热门专题