Spark-源码-Spark-StartAll Master Worler启动流程

Spark start-all>>

"""Master启动流程"""

Master类

class Master(

    host: String,

    port: Int,

    webUiPort: Int,

    val securityMgr: SecurityManager,

    val conf: SparkConf) extends Actor with ActorLogReceive with Logging with LeaderElectable

Master端

def main(){

	val (actorSystem, _, _, _) = startSystemAndActor(args.host, args.port, args.webUiPort, conf)

    actorSystem.awaitTermination()

}

Master端

def startSystemAndActor(System, Int, Int, Option[Int]) = {

	//调用AkkaUtils创建ActorSystem

	val (actorSystem, boundPort) = AkkaUtils.createActorSystem(systemName, host, port, conf = conf,

	  securityManager = securityMgr)

	//创建属于Master的actor, 在创建actor的同时, 会使用classOf[Master]初始化Master

	val actor = actorSystem.actorOf(Props(classOf[Master], host, boundPort, webUiPort, securityMgr, conf), actorName)

}

Master端

"""初始化Master时由于Master继承了 trait Actor 重写了preStart方法,

Actor的初始化会启动preStart方法 因此找到Master的 override def preStart()

preStart属于生命周期方法, 在构造器之后, receiver之前"""

override def preStart() {

	// 启动一个定时器, 定时检查超时的Worker, WORKER_TIMEOUT:每六十秒检查一次,

	// self:先对着自己来一下(检查)试试

	context.system.scheduler.schedule(0 millis, WORKER_TIMEOUT millis, self, CheckForWorkerTimeOut)

 	// 调用 timeOutDeadWorkers() 方法,

 	override def receiveWithLogging = {

	 	case CheckForWorkerTimeOut => {

	      timeOutDeadWorkers()

	    }

	}

	// 用来检查并移除所有超时的workers

	def timeOutDeadWorkers(){

		// 事实上是移除了一个存有WorkInfo的HashSet[WrokInfo]中的对象

		val toRemove = workers.filter(_.lastHeartbeat < currentTime - WORKER_TIMEOUT_MS).toArray

		for (worker <- toRemove) {

	      if (worker.state != WorkerState.DEAD) {

	        removeWorker(worker)

	      }

	    }

	}

	def removeWorker(worker: WorkerInfo){

		// 删除内存里的workInfo

		idToWorker -= worker.id

	    addressToWorker -= worker.endpoint.address

	}

}

"""之后执行receive方法(1.3版本), 在后来的1.6版本中叫 def receive: PartialFunction[Any, Unit]"""

Master端

override def receiveWithLogging () {}

会不断的接收actor发送过来的请求

"""Worker启动流程"""

Worker类

class Worker(

    host: String,

    port: Int,

    webUiPort: Int,

    cores: Int,

    memory: Int,

    masterAkkaUrls: Array[String],

    actorSystemName: String,

    actorName: String,

    workDirPath: String = null,

    val conf: SparkConf,

    val securityMgr: SecurityManager)

  extends Actor

def preStart() => {

  registerWithMaster()

}

// 向Master注册的方法

def registerWithMaster() {

  	// 向所有的Master注册Worker

  	tryRegisterAllMasters()

  	// 其中内容

  	def tryRegisterAllMasters()=>{

	  	// 通过Master的Url获取Master的actor

		val actor = context.actorSelection(masterAkkaUrl)

		// 向Master发送注册信息

	    actor ! RegisterWorker(workerId, host, port, cores, memory, webUi.boundPort, publicAddress)

	}

 }

Master端

// 接收Worker发送的注册信息

override def receiveWithLogging = {

	case RegisterWorker(id, workerHost, workerPort, cores, memory, workerUiPort, publicAddress) =>{

		// 判断是否是StandBy状态, doNothing

		idToWorker.contains(id), 已经注册过, doNothing

		正常情况下(Active状态, 且没有注册过):{

			// 把发送来的 WorkerInfo 添加到 Master的 WorkerInfo中

			val worker = new WorkerInfo(id, workerHost, workerPort, cores, memory, sender, workerUiPort, publicAddress)

		}

		// 如果将Worker Info存入内存成功, 则调用持久化引擎, 将信息存入磁盘中,

		// 目的是防止数据丢失. 如果Master宕机, 内存中会丢失数据,

		// 切换状态(Standby和Active)后, 需要切换的节点拿不到WorkerInfo, Worker会再次注册, 非常消耗资源, 存在磁盘则可以直接去磁盘拿取数据不需要重新注册

		if (registerWorker(worker)) {

	      persistenceEngine.addWorker(worker)

	      sender ! RegisteredWorker(masterUrl, masterWebUiUrl)

	      schedule()

	    }

		// 向worker响应注册成功信息

		sender ! RegisteredWorker(masterUrl, masterWebUiUrl)

		// 开始调度资源, 调度资源不仅仅是集群启动的时候调动资源, 运行Job的时候也会调度资源, 其有两种方式 一种是尽量分散, 一种是尽量集中

		schedule()

	}

}

Worker端

// 接收注册成功的信息, 其实是将 Active Master 的Url和rWebUiUrl传回并更新, 之后向他发送心跳~

def receiveWithLogging() = {

	case RegisteredWorker(masterUrl, masterWebUiUrl) =>{

		//更新MasterUrl

		changeMaster(masterUrl, masterWebUiUrl)

		//向Master发送心跳信息, HEARTBEAT_MILLIS =15秒, 每十五秒发送一次心跳信息, 发送逻辑为 SendHeartbeat

  		context.system.scheduler.schedule(0 millis, HEARTBEAT_MILLIS millis, self, SendHeartbeat)

	}

  	//向Master发送心跳信息, 实际上是将自己的WorkerId发送给Master

  	case SendHeartbeat =>

    	if (connected) { master ! Heartbeat(workerId) }

}

Master端

def receiveWithLogging() = {

	case Heartbeat(workerId) => {

		//正常情况下, 更新上次心跳时间

		workerInfo.lastHeartbeat = System.currentTimeMillis()

		//启动完成

	}

}

Spark-源码-Spark-StartAll Master Worler启动流程的更多相关文章

Flink 源码解析 —— Standalone Session Cluster 启动流程深度分析之 Job Manager 启动
Job Manager 启动 https://t.zsxq.com/AurR3rN 博客 1.Flink 从0到1学习 -- Apache Flink 介绍 2.Flink 从0到1学习 -- Mac ...
Flink 源码解析 —— Standalone session 模式启动流程
Standalone session 模式启动流程 https://t.zsxq.com/EemAEIi 博客 1.Flink 从0到1学习 -- Apache Flink 介绍 2.Flink 从0 ...
Flink 源码解析 —— Standalone Session Cluster 启动流程深度分析之 Task Manager 启动
Task Manager 启动 https://t.zsxq.com/qjEUFau 博客 1.Flink 从0到1学习 -- Apache Flink 介绍 2.Flink 从0到1学习 -- Ma ...
Caddy源码阅读（二）启动流程与 Event 事件通知
Caddy源码阅读(二)启动流程与 Event 事件通知 Preface Caddy 是 Go 语言构建的轻量配置化服务器.https://github.com/caddyserver/caddy C ...
DolphinScheduler 源码剖析之 Master 容错处理流程
点击上方蓝字关注 Apache DolphinScheduler Apache DolphinScheduler(incubating),简称"DS", 中文名 "海豚调 ...
头秃了，二十三张图带你从源码了解Spring Boot 的启动流程~
持续原创输出,点击上方蓝字关注我目录前言源码版本从哪入手? 源码如何切分? 如何创建SpringApplication? 设置应用类型设置初始化器(Initializer) 设置监听器(Li ...
Tomcat8源码笔记(九)组件StandardContext启动流程--未完待续
StandardContext代表的是webapps下项目,一个项目就是一个StandardContext,作为Tomcat组件的一部分,就会实现Lifecycle接口,被Tomcat管理着生命周期, ...
Spark源码分析之Sort-Based Shuffle读写流程
一 .概述我们知道Spark Shuffle机制总共有三种: 1.未优化的Hash Shuffle:每一个ShuffleMapTask都会为每一个ReducerTask创建一个单独的文件,总的文件数 ...
Apache DolphinScheduler 源码剖析之 Worker 容错处理流程
今天给大家带来的分享是 Apache DolphinScheduler 源码剖析之 Worker 容错处理流程 DolphinScheduler源码剖析之Worker容错处理流程 Worker容错流程 ...

随机推荐

ant用法
下载ant包,解压版,解压到某目录后配置环境变量即可,这里不在赘述.配置成功cmd ant-version,显示ant版本即OK. ant是Apache的跨平台的构建工具,他可以实 ...
Thread类的sleep()方法和对象的wait()方法都可以让线程暂停执行，它们有什么区别? 线程的sleep()方法和yield()方法有什么区别？
Thread类的sleep()方法和对象的wait()方法都可以让线程暂停执行,它们有什么区别? sleep()方法(休眠)是线程类(Thread)的静态方法,调用此方法会让当前线程暂停执行指定的时间 ...
Zookeeper的集群配置和Java测试程序
Zookeeper是Apache下的项目之一,倾向于对大型应用的协同维护管理工作.IBM则给出了IBM对ZooKeeper的认知: Zookeeper 分布式服务框架是 Apache Hadoop 的 ...
Selenium2学习（三）-- 八种元素元素定位（Firebug和firepath）
前言自动化只要掌握四步操作:获取元素,操作元素,获取返回结果,断言(返回结果与期望结果是否一致),最后自动出测试报告.本篇主要讲如何用firefox辅助工具进行元素定位.元素定位在这四个环节中是至关 ...
March 30 2017 Week 13 Thursday
I learned the value of hard work by working hard. 只有真的努力了,才会知道努力的价值. On the day, March 12th 2017, I ...
IOS 摇一摇的方法
● 监控摇一摇的方法 ● 方法1:通过分析加速计数据来判断是否进行了摇一摇操作(比较复杂) ● 方法2:iOS自带的Shake监控API(非常简单) ● 判断摇一摇的步骤:实现3个摇一摇监听方法 ● ...
Type Syntax error, insert ")" to complete Expression
今天倒持了几个小时! 愣是没有明确 ,为什么我的JSP的第一行没有代码? 还是报错! 错误是: Description Resource Path Location Type Sy ...
VMWARE下CentOS7虚拟机网络配置
注:本文仅针对新装的虚拟机,#ip addr 获取不到ip信息,无法连接网络的情况提供一种参考解决方案. 1.左上角点击“编辑”->“虚拟网络编辑器”.新建一个NAT模式的网络. 2.配置虚拟机 ...
python 并发编程之协程
一.协程协程: 单线程下的并发,又称微线程.协程是一种用户态的的轻量级线程,即协程是由用户程序自己控制调度的. 协程的本质就是在单线程下,由用户自己控制一个任务,遇到 io 阻塞就切换另外一个 ...
o'Reill的SVG精髓（第二版）学习笔记——第十一章
第十一章:滤镜 11.1滤镜的工作原理当SVG阅读器程序处理一个图形对象时,它会将对象呈现在位图输出设备上:在某一时刻,阅读器程序会把对象的描述信息转换为一组对应的像素,然后呈现在输出设备上.例如我 ...

Spark-源码-Spark-StartAll Master Worler启动流程

Spark-源码-Spark-StartAll Master Worler启动流程的更多相关文章

随机推荐

热门专题