Spark内核架构原理 1.Driver 选spark节点之一,提交我们编写的spark程序,开启一个Driver进程,执行我们的Application应用程序,也就是我们自己编写的代码.Driver会根据我们对RDD定义的操作,提交一大堆的task去Executor上.Driver注册了一些Executor之后,就可以开始正式执行我们的Spark应用程序了,首先第一步,创建初始RDD,读取数据.HDFS文件内容被读取到多个Worker节点上,形成内存中的分布式数据集,也就是初始RDD. 2.M…