LevelDB源码之四LOG文件

“LOG文件在LevelDb中的主要作用是系统故障恢复时，能够保证不会丢失数据。因为在将记录写入内存的Memtable之前，会先写入Log文件，这样即使系统发生故障，Memtable中的数据没有来得及Dump到磁盘的SSTable文件，LevelDB也可以根据log文件恢复内存的Memtable数据结构内容，不会造成系统丢失数据，在这点上LevelDb和Bigtable是一致的。” (http://www.cnblogs.com/haippy/archive/2011/12/04/2276064.html)

准备工作：

Log文件只涉及顺序读、顺序写两种操作，而在LevelDB中的其他文件（如SSTable）还会设计随机读操作，作者针对每种操作类型做了封装：

     class SequentialFile {

     public:

         virtual Status Read(size_t n, Slice* result, char* scratch) = ;

         virtual Status Skip(uint64_t n) = ;

     };

     class RandomAccessFile {

     public:

         virtual Status Read(uint64_t offset, size_t n, Slice* result,

             char* scratch) const = ;

     };

     class WritableFile {

     public:

         virtual Status Append(const Slice& data) = ;

         virtual Status Close() = ;

         virtual Status Flush() = ;

         virtual Status Sync() = ;

     };

操作系统相关操作在不同系统下，实现各不相同，作者也做了统一的接口封装(跨平台)，称之为“环境类”Env：

     class Env {

     public:

         Env() { }

         virtual ~Env();

         // Return a default environment suitable for the current operating

         // system.

         static Env* Default();

 　　　　//基于不同的操作系统实现了各种文件类型的具体类，通过该工厂方法返回。

         virtual Status NewSequentialFile(const std::string& fname, SequentialFile** result) = ;

         virtual Status NewRandomAccessFile(const std::string& fname, RandomAccessFile** result) = ;

         virtual Status NewWritableFile(const std::string& fname, WritableFile** result) = ;

 ......

     };

写入

Leveldb命名空间下，有一个名为log的子命名空间，其下有Writer、Reader两个实现类。按前几节的命名规则，Writer其实是一个Builder，它对外提供了唯一的AddRecord方法用于追加操作记录。

         Status Writer::AddRecord(const Slice& slice) {

             const char* ptr = slice.data();

             size_t left = slice.size();

             // Fragment the record if necessary and emit it.  Note that if slice

             // is empty, we still want to iterate once to emit a single

             // zero-length record

             Status s;

             bool begin = true;

             do {

                 const int leftover = kBlockSize - block_offset_;    //1. 当前块剩余大小

                 assert(leftover >= );

                 if (leftover < kHeaderSize)                         //2. 剩余大小不足，占位

                 {

                     // Switch to a new block

                     if (leftover > )

                     {

                         // Fill the trailer (literal below relies on kHeaderSize being 7)

                         assert(kHeaderSize == );

                         dest_->Append(Slice("\x00\x00\x00\x00\x00\x00", leftover));

                     }

                     block_offset_ = ;

                 }

                 // Invariant: we never leave < kHeaderSize bytes in a block.

                 assert(kBlockSize - block_offset_ - kHeaderSize >= );

                 const size_t avail = kBlockSize - block_offset_ - kHeaderSize;

                 const size_t fragment_length = (left < avail) ? left : avail;    //3. 当前块存储的空间大小

                 RecordType type;                                                //4. Record Type

                 const bool end = (left == fragment_length);

                 if (begin && end) {

                     type = kFullType;

                 }

                 else if (begin) {

                     type = kFirstType;

                 }

                 else if (end) {

                     type = kLastType;

                 }

                 else {

                     type = kMiddleType;

                 }

                 s = EmitPhysicalRecord(type, ptr, fragment_length);            //5. 写入文件

                 ptr += fragment_length;

                 left -= fragment_length;

                 begin = false;

             } while (s.ok() && left > );

             return s;

         }

备忘如下：

Log文件被逻辑上分为多个Block，每个Block大小为32K。
每条记录由Record Header + Record Content组成，其中Header大小为kHeaderSize(7字节)。
当前Block剩余大小不足以填充Record Header时，以"\x00\x00\x00\x00\x00\x00"占位。
当Block无法完整记录一条Record时，通过type信息标识该record在当前block中的区块信息，以便读取时可根据type拼接出完整的record。
EmitPhysicalRecord向Block中插入Record数据
每个Record结构如下：

Header			Record Content
CRC	Record Size	Type	Record Content

读取

Log读取逻辑并无特别之处，略。

注：LOG文件和活动的MemTable对应，当活动的MemTable将被切换为非活动(immutable)MemTable时，将创建新的LOG文件。

原本Current、Manifest与Log打算一起备注，但要搞清楚Manifest，LevelDB的版本机制必定要搞清楚，而这本身又是很丰富的内容。

LevelDB源码之四LOG文件的更多相关文章

LevelDB源码之五Current文件\Manifest文件\版本信息
版本信息有什么用?先来简要说明三个类的具体用途: Version:代表了某一时刻的数据库版本信息,版本信息的主要内容是当前各个Level的SSTable数据文件列表. VersionSet:维护了一份 ...
LevelDB源码剖析
LevelDB的公共部件并不复杂,但为了更好的理解其各个核心模块的实现,此处挑几个关键的部件先行备忘. Arena(内存领地) Arena类用于内存管理,其存在的价值在于: 提高程序性能,减少Heap ...
leveldb源码分析--日志
我们知道在一个数据库系统中为了保证数据的可靠性,我们都会记录对系统的操作日志.日志的功能就是用来在系统down掉的时候对数据进行恢复,所以日志系统对一个要求可靠性的存储系统是极其重要的.接下来我们分析 ...
leveldb源码分析--Key结构
[注]本文参考了sparkliang的专栏的Leveldb源码分析--3并进行了一定的重组和排版经过上一篇文章的分析我们队leveldb的插入流程有了一定的认识,而该文设计最多的又是Batch的概念 ...
leveldb 源码--总体架构分析
一本文目的对leveldb的总体设计框架分析(关于leveldb基本原理,此文不做阐述,读者可以自行检索文章阅读即可),对leveldb中底层数据存储数据格式,内存数据模型,compact,版本管 ...
Leveldb源码分析--1
coming from http://blog.csdn.net/sparkliang/article/details/8567602 [前言:看了一点oceanbase,没有意志力继续坚持下去了,暂 ...
MyBatis 源码分析 - 映射文件解析过程
1.简介在上一篇文章中,我详细分析了 MyBatis 配置文件的解析过程.由于上一篇文章的篇幅比较大,加之映射文件解析过程也比较复杂的原因.所以我将映射文件解析过程的分析内容从上一篇文章中抽取出来, ...
leveldb源码分析--SSTable之block
在SSTable中主要存储数据的地方是data block,block_builder就是这个专门进行block的组织的地方,我们来详细看看其中的内容,其主要有Add,Finish和CurrentSi ...
leveldb源码学习系列
楼主从2014年7月份开始学习<>,由于书籍比较抽象,为了加深思考,同时开始了Google leveldb的源码学习,主要是想学习leveldb的设计思想和Google的C++编程规范.目 ...

随机推荐

relative和absolute的效果
我对这样几个效果不是特别理解: 1.float的效果: 就是搞不清楚我想要什么效果的时候可以将某个标签设置为float,一直没总结出什么规律. 2.relative和absolute的效果: 也是不清 ...
centos 6.5 安装 buildbot-slave 0.8.9
公司服务器多数都用的centos,这个是大环境,改不了,只好研究怎么安装buildbot-slave. buildbot-master倒是没有问题,可控,自己弄了一个ubuntu14来玩. cento ...
Codeforces 626C Block Towers「贪心」「二分」「数学规律」
题意: 一堆人用方块盖塔,有n个人每次只能加两块方块,有m个人每次只能加三块方块.要求每个人盖的塔的高度都不一样,保证所用方块数最少,求最高的塔的高度. 0<=n+m 0<=n,m< ...
cocos2dx 菜单按钮回调方法传参 tag传参
.h文件 void menuCallBack(CCObject* pSender); .cpp CCMenuItemSprite* item = CCMenuItemSprite::create( m ...
spring获取bean的时候严格区分大小写
如题:spring获取bean的时候严格区分大小写配置文件helloservice.xml中配置: <dubbo:reference id="IInsurance" int ...
maven Spring获取不到配置文件
如题: 如果在maven项目中,Spring获取不到配置文件, 把配置文件放到.src/main/resource文件夹下即可 import org.springframework.context.s ...
OC基础(9)
OC中的私有方法 @property基本概念 @synthesize基本概念 @property增强 @property修饰符 *:first-child { margin-top: 0 !impor ...
内省—beanutils工具包
Apache组织开发了一套用于操作JavaBean的API,这套API考虑到了很多实际开发中的应用场景,因此在实际开发中很多程序员使用这套API操作JavaBean,以简化程序代码的编写. BeanU ...
UVA 10892 - LCM Cardinality
Problem F LCM Cardinality Input: Standard Input Output: Standard Output Time Limit: 2 Seconds A pair ...
Social networks and health: Communicable but not infectious
Harvard Men’s Health Watch Poet and pastor John Donne famously proclaimed “No man is an island.” It ...

LevelDB源码之四LOG文件

LevelDB源码之四LOG文件的更多相关文章

随机推荐

热门专题