一.原理 1.Checkpoint是什么 Checkpoint,是Spark提供的一个比较高级的功能. 有的时候,比如说,我们的Spark应用程序,特别的复杂,然后呢,从初始的RDD开始,到最后整个应用程序完成,有非常多的步骤, 比如超过20个transformation操作.而且呢,整个应用运行的时间也特别长,比如通常要运行1~5个小时. 在上述情况下,就比较适合使用checkpoint功能.因为,对于特别复杂的Spark应用,有很高的风险,会出现某个要反复使用的RDD, 因为节点的故障,虽然…