文章目录 准备知识 DAG 概述 shuffle 概述 SortShuffleManager 普通机制 bypass机制 Spark任务调度 流程 准备知识 要弄清楚Spark的任务调度流程,就必须要清楚RDD.Lineage.DAG和shuffle的相关知识,关于RDD和Lineage,我的这两天文章已经有过相关介绍,感兴趣可以去看一看 [Spark]RDD(Resilient Distributed Dataset)究竟是什么? [Spark]RDD的依赖关系和缓存相关知识点接下来说一下DA…