思考是一件有意思的事情.遇到问题,思考出结论,那么脑子里面的过程是什么呢,或者脑子里面是什么呢.我一直认为,这团团的里面是一个模糊的n维空间.理解一个复杂的系统.公式.算法,都要在这个n维空间里具象化.这个具象化的镜像的精确度就代表了理解的深入度.想起了,考研的时候,太用力,每天晚上脑袋里镜像不断刷新的画面. 最近一直在折腾spark,项目赶得飞快,理解上的问题也一直在积压.今天慢慢梳理,突然发现脑袋里面的镜像构建的不对. spark的rdd是分布式的存储在内存中的,每个stage的边界是宽依赖…