【转】Spark源码分析之-Storage模块

原文地址：http://blog.csdn.net/aiuyjerry/article/details/8595991

Storage模块主要负责数据存取，包括MapReduce Shuffle中间结果、MapReduce task中间stage结果、cache结果。下面从架构和源码细节上来分析Storage模块的实现。Storage模块主要由两大部分组成：

BlockManager部分主要负责Master和Slave之间的block通信，主要包括BlockManager状态上报、心跳，add, remove, update block.
BlockStore部分主要负责数据存取，Spark根据不同选择可以在Memory或(和)Disk中存储序列化数据.

Storage模块类图如下所示：

SparkEnv创建时会实例化BlockManagerMaster对象和BlockManager对象。
BlockManagerMaster对象会根据自己是master还是slave来创建BlockManagerMasterActor或是连接到BlockManagerMasterActor。
BlockManager承担两种角色：
1. 负责向BlockManagerMaster上报block信息，保持心跳和接收block信息
2. 负责通过BlockStore从Memory或Disk读取、写入block数据
BlockManagerMessages封装与master传输的meta信息的具体格式。
Slave通过BlockManager向BlockManagerMaster注册自己，在注册自己时会创建BlockManagerSlaveActor，用来Master向Slave通信，目前唯一request是请求Slave删除block。
BlockManagerWorker则负责Slave之间的通信，包括get, put非本地的block
BlockMessage类封装了与Master通信的block message的具体格式，而BlockMessageArray则是批处理接口。
BlockStore提供持久化数据的接口，DiskStore和MemoryStore实例化了BlockStore接口，实现serialize, deserialize数据到Disk或Memory。

Spark Storage模块master和slave之间通信的信息包括：

Slave --------> Master
- RegisterBlockManager
- HeartBeat
- UpdateBlockInfo
- GetLocations
- GetLocationsMutipleBlockIds
- GetPeers
- RemoveExecutor
- StopBlockManagerMaster
- GetMemoryStatus
- ExpireDeadHosts
- GetStorageStatus
Master ---------> Slave
- RemoveBlock

Storage模块存取数据分析

MemoryStore：

Memory内部使用LinkedHashMap来作为block的存储结构，其中key是block id，value是Entry类，代码如所示:

  case class Entry(value: Any, size: Long, deserialized: Boolean, var dropPending: Boolean = false)

  private val entries = new LinkedHashMap[String, Entry](32, 0.75f, true)

而内部存储会调用如下代码：

  private def tryToPut(blockId: String, value: Any, size: Long, deserialized: Boolean): Boolean = {

    putLock.synchronized {

      if (ensureFreeSpace(blockId, size)) {

        val entry = new Entry(value, size, deserialized)

        entries.synchronized { entries.put(blockId, entry) }

        currentMemory += size

        if (deserialized) {

          logInfo("Block %s stored as values to memory (estimated size %s, free %s)".format(

            blockId, Utils.memoryBytesToString(size), Utils.memoryBytesToString(freeMemory)))

        } else {

          logInfo("Block %s stored as bytes to memory (size %s, free %s)".format(

            blockId, Utils.memoryBytesToString(size), Utils.memoryBytesToString(freeMemory)))

        }

        true

      } else {

        // Tell the block manager that we couldn't put it in memory so that it can drop it to

        // disk if the block allows disk storage.

        val data = if (deserialized) {

          Left(value.asInstanceOf[ArrayBuffer[Any]])

        } else {

          Right(value.asInstanceOf[ByteBuffer].duplicate())

        }

        blockManager.dropFromMemory(blockId, data)

        false

      }

    }

  }

  private def ensureFreeSpace(blockIdToAdd: String, space: Long): Boolean = {

    logInfo("ensureFreeSpace(%d) called with curMem=%d, maxMem=%d".format(

      space, currentMemory, maxMemory))

    if (space > maxMemory) {

      logInfo("Will not store " + blockIdToAdd + " as it is larger than our memory limit")

      return false

    }

    if (maxMemory - currentMemory < space) {

      val rddToAdd = getRddId(blockIdToAdd)

      val selectedBlocks = new ArrayBuffer[String]()

      var selectedMemory = 0L

      entries.synchronized {

        val iterator = entries.entrySet().iterator()

        while (maxMemory - (currentMemory - selectedMemory) < space && iterator.hasNext) {

          val pair = iterator.next()

          val blockId = pair.getKey

          if (rddToAdd != null && rddToAdd == getRddId(blockId)) {

            logInfo("Will not store " + blockIdToAdd + " as it would require dropping another " +

              "block from the same RDD")

            return false

          }

          selectedBlocks += blockId

          selectedMemory += pair.getValue.size

        }

      }

      if (maxMemory - (currentMemory - selectedMemory) >= space) {

        logInfo(selectedBlocks.size + " blocks selected for dropping")

        for (blockId <- selectedBlocks) {

          val entry = entries.synchronized { entries.get(blockId) }

          // This should never be null as only one thread should be dropping

          // blocks and removing entries. However the check is still here for

          // future safety.

          if (entry != null) {

            val data = if (entry.deserialized) {

              Left(entry.value.asInstanceOf[ArrayBuffer[Any]])

            } else {

              Right(entry.value.asInstanceOf[ByteBuffer].duplicate())

            }

            blockManager.dropFromMemory(blockId, data)

          }

        }

        return true

      } else {

        return false

      }

    }

    return true

  }

tryToPut会调用ensureFreeSpace来淘汰掉一些block，为此block的存储释放新的空间，而tryToPut会将其添加到LinkedHashMap中。如果ensureFreeSpace无法获得足够的空间去存储此block，tryToPut会调用dropFreeMemory来drop此block。

DiskStore：

Spark会根据配置项spark.local.dir在本地建立目录，所有的block都会依照不同路径存储到此目录下，当spark.local.dir中配置了多个path时，Spark会根据hash将block存储到不同的path下

首先，Spark会根据spark.local.dir的配置在所有配置目录下建立localDir，localDir命名为spark-local-%s-%04x,其中%s是格式化后的当前时间(yyyyMMddHHmmss)，%d是一个小于65535的随机16进制数字。
其次，每当要存储block时，Spark会根据blockId在localDir下建立子目录和相应的文件，block存储目录的选择规律是：
1. 根据blockId的hash值计算出dirId和subDirId
2. 取出或创建subDir
3. 在subDir下面以blockId为名字创建文件

    val subDirsPerLocalDir = System.getProperty("spark.diskStore.subDirectories", "64").toInt

    val subDirs = Array.fill(localDirs.length)(new Array[File](subDirsPerLocalDir))

    // Figure out which local directory it hashes to, and which subdirectory in that

    val hash = math.abs(blockId.hashCode)

    val dirId = hash % localDirs.length

    val subDirId = (hash / localDirs.length) % subDirsPerLocalDir

    // Create the subdirectory if it doesn't already exist

    var subDir = subDirs(dirId)(subDirId)

    if (subDir == null) {

      subDir = subDirs(dirId).synchronized {

        val old = subDirs(dirId)(subDirId)

        if (old != null) {

          old

        } else {

          val newDir = new File(localDirs(dirId), "%02x".format(subDirId))

          newDir.mkdir()

          subDirs(dirId)(subDirId) = newDir

          newDir

        }

      }

    }

    new File(subDir, blockId)

最后，根据压缩和序列化方式选择将block存储到文件中

【转】Spark源码分析之-Storage模块的更多相关文章

Spark源码分析之-Storage模块
原文链接:http://jerryshao.me/architecture/2013/10/08/spark-storage-module-analysis/ Background 前段时间琐事颇多, ...
【转】Spark源码分析之-deploy模块
原文地址:http://jerryshao.me/architecture/2013/04/30/Spark%E6%BA%90%E7%A0%81%E5%88%86%E6%9E%90%E4%B9%8B- ...
【转】Spark源码分析之-scheduler模块
原文地址:http://jerryshao.me/architecture/2013/04/21/Spark%E6%BA%90%E7%A0%81%E5%88%86%E6%9E%90%E4%B9%8B- ...
Spark源码分析 – BlockManager
参考, Spark源码分析之-Storage模块对于storage, 为何Spark需要storage模块?为了cache RDD Spark的特点就是可以将RDD cache在memory或dis ...
Spark源码分析 – 汇总索引
http://jerryshao.me/categories.html#architecture-ref http://blog.csdn.net/pelick/article/details/172 ...
Spark源码分析 – Deploy
参考, Spark源码分析之-deploy模块 Client Client在SparkDeploySchedulerBackend被start的时候, 被创建, 代表一个application和s ...
Spark源码分析 – SparkContext
Spark源码分析之-scheduler模块这位写的非常好, 让我对Spark的源码分析, 变的轻松了许多这里自己再梳理一遍先看一个简单的spark操作, val sc = new SparkC ...
Spark源码分析之九：内存管理模型
Spark是现在很流行的一个基于内存的分布式计算框架,既然是基于内存,那么自然而然的,内存的管理就是Spark存储管理的重中之重了.那么,Spark究竟采用什么样的内存管理模型呢?本文就为大家揭开Sp ...
spark 源码分析之十五 -- Spark内存管理剖析
本篇文章主要剖析Spark的内存管理体系. 在上篇文章 spark 源码分析之十四 -- broadcast 是如何实现的?中对存储相关的内容没有做过多的剖析,下面计划先剖析Spark的内存机制,进而 ...

随机推荐

go指针的一个小坑
几乎可以肯定的说,go语言中除了闭包在引用外部变量的时候是传引用的,其他的时候都是传值的.如果你说形参可以定义为指针.好吧,那么告诉你这个指针的值其实是按照传值的方式使用的. 下面看个很浅显的例子: ...
（最小生成树）Jungle Roads -- HDU --1301
链接: http://acm.hdu.edu.cn/showproblem.php?pid=1301 http://acm.hust.edu.cn/vjudge/contest/view.action ...
java 泛型的类型擦除和桥方法
oracle原文地址:https://docs.oracle.com/javase/tutorial/java/generics/erasure.html 在Java中,泛型的引入是为了在编译时提供强 ...
“一键GHOST”系统备份与还原（icmzn）
“一键GHOST”系统备份与还原(icmzn) 1.软件介绍软件名称:一键GHOST 软件版本:v2014.01.14 安装环境:WINXP/2000/2003/WIN7/VISTA/2008/WI ...
hdu1089 Ignatius's puzzle
题目其实这道题不是很难,但是我刚开始拿到这道题的时候不知道怎么做, 因为这个式子我就不知道是干什么的: 65|f(x) 百度解释(若a/b=x...0 称a能被b整除,b能整除a,即b|a,读作& ...
Java中取两位小数
请参考下面函数: private String getFormated(String s){ float f=Float.parseFloat(s); java.text. ...
CentOS7 Docker 安装
CentOS7 已经内置了docker ,可以直接安装安装Docker 命令: sudo yum install -y docker 启动docker 命令: service docker st ...
查看Linux服务器被映射的公网ip
查看Linux服务器被映射的公网ip 现在云服务器非常流行,不仅企业甚至是个人都可能拥有自己的云服务器,但是目前的云服务器厂商提供的公网IP大都是映射而来,所以在Linux服务器上执行ifconf ...
.NET 调试入门（二） dump 出程序数据
前言有时候我们需要看程序中运行情况怎么,如:某对象字段的具体值是多少等问题,我们就可以用调试工具找到答案.我们还是沿用前面的程序.原代码在文章低部. dump栈上的值在线程4中输 ...
NetCore入门篇：（九）Net Core项目使用Session及用Redis做分布式
一.简介 1.因为Net Core默认是没有启动Session功能的,如果需要使用,需要通过代码开启. 2.本篇说明如果启用默认Session实现,即Session存到内存中. 3.本篇扩展说明如何用 ...

【转】Spark源码分析之-Storage模块

原文地址：http://blog.csdn.net/aiuyjerry/article/details/8595991

【转】Spark源码分析之-Storage模块的更多相关文章

随机推荐

热门专题