leveldb源码分析--Iterator遍历数据库

在DBImpl中有一个函数声明为Iterator* DBImpl::NewIterator(const ReadOptions& options) ，他返回一个可以遍历或者搜索数据库的迭代器句柄。

Iterator* DBImpl::NewIterator(const ReadOptions& options) {

  SequenceNumber latest_snapshot;

  uint32_t seed;

  Iterator* iter = NewInternalIterator(options, &latest_snapshot, &seed);

  return NewDBIterator(

      this, user_comparator(), iter,

      (options.snapshot != NULL

       ? reinterpret_cast<const SnapshotImpl*>(options.snapshot)->number_

       : latest_snapshot),

可以看到这个函数就是获得一个内部迭代器句柄然后再用NewDBIterator包装返回一个DBIter，这个DBIter的目的就是作为内部迭代器的桥接封装的作用，方便用户调用。其接口函数大致有：

virtual bool Valid() const;

  virtual Slice key() cons;

  virtual Slice value() const;

  virtual Status status() const ;

  virtual void Next();

  virtual void Prev();

  virtual void Seek(const Slice& target);

  virtual void SeekToFirst();

  virtual void SeekToLast();

这些封装只是对InternalIterator的一个简单封装，他们都以依赖于一个这个InternalIterator。我们来看看InternalIterator的获取

Iterator* DBImpl::NewInternalIterator(const ReadOptions& options,

                                      SequenceNumber* latest_snapshot,

                                      uint32_t* seed) {

  IterState* cleanup = new IterState;

  mutex_.Lock();

  *latest_snapshot = versions_->LastSequence();

  // Collect together all needed child iterators

  std::vector<Iterator*> list;

  list.push_back(mem_->NewIterator());

  mem_->Ref();

  if (imm_ != NULL) {

    list.push_back(imm_->NewIterator());

    imm_->Ref();

  }

  versions_->current()->AddIterators(options, &list);

  Iterator* internal_iter =

      NewMergingIterator(&internal_comparator_, &list[0], list.size());

  versions_->current()->Ref();

  cleanup->mu = &mutex_;

  cleanup->mem = mem_;

  cleanup->imm = imm_;

  cleanup->version = versions_->current();

  internal_iter->RegisterCleanup(CleanupIteratorState, cleanup, NULL);

  *seed = ++seed_;

  mutex_.Unlock();

  return internal_iter;

}

这里internal_iter的获取是从memTable、imm、还有version取得的所有与迭代器全部传入到一个MergingIterator中。在详细介绍这个MergingIterator前我们先来看看一个简化的例子，并且假设此时没有imm_table。这样我们现在有一个Memtable，SSTable中level0有两个文件，有一个level1的文件，里面的key大致如下(我们根据新旧程度排序，数据新旧依据请查阅Compaction章节）：

Memtable: 1,2,3,4,5,6

level0-2: 3,4,7,6

level0-1: 2,3,4,6

level1: 1,3,6,7,9…

这样，如果我们开始从第一个key开始以递增（Next）的方式遍历整个数据库，那么我们可以见到如下的过程。首先是每个初始化一个指向当前文件（这里暂时将Memtable也当做一个文件）第一个位置的指针，如下红色表示当前指向的指针：

Memtable: 1,3,4,5,6

level0-2: 3,4,7,6

level0-1: 2,3,4,6

level1: 1,3,6,7,9…

这样，我们根据数据最新关系我们很容易判断第一个key应该为Memtable中的1，我们记该当前key为1。然后再调用Next，调用Next的时候就需要将Memtable和level1中的当前指针key为1的向后一个key（level1中的移动在leveldb中是在FindSmallest中进行的），得到如下：

Memtable: 1,3,4,5,6

level0-2: 3,4,7,6

level0-1: 2,3,4,6

level1: 1,2,6,7,9…

那么这个时候我们也很容以判断这里的next的值应该是level0-1中的2。那么我做出这个判断的过程是怎么样的呢？应该是找出当前每个文件中指针指向的值中最小的那个key，如果有多个文件中当前指针key相同的时候，那么就应该取最新的那个文件中。再继续Next，

Memtable: 1,3,4,5,6

level0-2: 3,4,7,6

level0-1: 2,3,4,6

level1: 1,2,6,7,9…

那么此时应该是Memtable中的3。那么此时我们需要先前查找当前3的前一个呢？很明显我们应该回到上面第三个图的状态，应该level1，level0-1都进行回溯，然后选择最小的那个。但是如何能回到该状态呢？如果这样的话我们必须记录每次移动的过程，这种过程性的记录在程序设计中是十分难以做到的。而在leveldb中也采用了另外一种方式，就是在我们的迭代器器中记录一个当前遍历的值比如此时的level0-1中的3进行一个Prev，然后再查找最大值，最大值方式的时候如果大于3就继续往前回溯，再找到最大的最新的。形成的状态如下：

Memtable: 1,3,4,5,6 //找到3，然后在prev到1

level0-2: 3,4,7,6 //此处其实应该为invalid，即找到3，prev到invalid

level0-1: 2,3,4,6 //找到3，prev到2

level1: 1,2,6,7,9… /找到6，prev到2

而查找的最大最新值也应该是level0-1中的2。

下面我们来看看代码Prev的实现：

virtual void Prev() {

  if (direction_ != kReverse) {// 如果之前遍历方向向后

      for (int i = 0; i < n_; i++) {

        IteratorWrapper* child = &children_[i];

        if (child != current_) {

          child->Seek(key());// 查找遍历当前值，然后再往前回溯

          if (child->Valid()) {

            // Child is at first entry >= key().  Step back one to be < key()

            child->Prev();

          } else {

            //没有>当前key值的key.

            child->SeekToLast();

          }

        }

      }

      direction_ = kReverse;

    }

    current_->Prev();

    FindLargest();

  }

virtual void Next() {

    if (direction_ != kForward) {

      for (int i = 0; i < n_; i++) {

        IteratorWrapper* child = &children_[i];

        if (child != current_) {

          child->Seek(key());

          if (child->Valid() &&// 如果key为当前key相等，向后next

              comparator_->Compare(key(), child->key()) == 0) {

            child->Next();

          }

        }

      }

      direction_ = kForward;

    }

    current_->Next();

    FindSmallest();

  }

所以再调用Next的过程就为：查找 >= 2的，如果找到并且==2就Next，然后找最小的最新的一个位置。

Memtable: 1,3,4,5,6 //找到3

level0-2: 3,4,7,6 //找到3

level0-1: 2,3,4,6 //这里是先找到2，然后再Next

level1: 1,2,6,7,9… //同上

所以这里的操作就变成了查找

我们详细看看Next

void DBIter::Next() {

  assert(valid_);

  if (direction_ == kReverse) {  // Switch directions?

    direction_ = kForward;

    // 如果上次已经到最后，回溯到第一个

    if (!iter_->Valid()) {

      iter_->SeekToFirst();

    } else {

      iter_->Next();

    }

    if (!iter_->Valid()) {

      valid_ = false;

      saved_key_.clear();

      return;

    }

    // saved_key_ already contains the key to skip past.

  } else {

    // 存储当前key，以备下次为Prev时查找这个key.

    SaveKey(ExtractUserKey(iter_->key()), &saved_key_);

  }

  FindNextUserEntry(true, &saved_key_);

}

这里由于leveldb遍历数据库时涉及到多个数据文件及内存中的Memtable，所以每次调用prev和next时会有比较复杂的处理。

void DBIter::FindNextUserEntry(bool skipping, std::string* skip) {

  // Loop until we hit an acceptable entry to yield

  assert(iter_->Valid());

  assert(direction_ == kForward);

  do {

    ParsedInternalKey ikey;

    if (ParseKey(&ikey) && ikey.sequence <= sequence_) {

      switch (ikey.type) {

        case kTypeDeletion:

          // 如果为删除，标记后面的已删除的key应该跳过

          // 保存跳过的key

          SaveKey(ikey.user_key, skip);

          skipping = true;

          break;

        case kTypeValue:

          if (skipping &&

              user_comparator_->Compare(ikey.user_key, *skip) <= 0) {

            // 小于等于，跳过

          } else {//找到值，返回

            valid_ = true;

            saved_key_.clear();

            return;

          }

          break;

      }

    }

    iter_->Next();

  } while (iter_->Valid());

  saved_key_.clear();

  valid_ = false;

}

这里我们不再对DBIter中的其他函数进行一一介绍，比如Prev和这里也是一个类似的（但是比较相反）处理过程。稍微提一下的是我们在void DBIter::FindPrevUserEntry() 中有如下一段代码

if (saved_value_.capacity() > raw_value.size() + 1048576) {

            std::string empty;

            swap(empty, saved_value_);

          }

这里当saved_value中的长度超过一定的值以后我们将其交换给一个零时变量，这样在超出其域以后析构时就可以对其内部的内存进行释放，而如果只是改变其大小内存则得不到释放。

leveldb源码分析--Iterator遍历数据库的更多相关文章

leveldb源码分析--WriteBatch
从[leveldb源码分析--插入删除流程]和WriteBatch其名我们就很轻易的知道,这个是leveldb内部的一个批量写的结构,在leveldb为了提高插入和删除的效率,在其插入过程中都采用了批 ...
leveldb源码分析--Key结构
[注]本文参考了sparkliang的专栏的Leveldb源码分析--3并进行了一定的重组和排版经过上一篇文章的分析我们队leveldb的插入流程有了一定的认识,而该文设计最多的又是Batch的概念 ...
leveldb源码分析--SSTable之block
在SSTable中主要存储数据的地方是data block,block_builder就是这个专门进行block的组织的地方,我们来详细看看其中的内容,其主要有Add,Finish和CurrentSi ...
Leveldb源码分析--1
coming from http://blog.csdn.net/sparkliang/article/details/8567602 [前言:看了一点oceanbase,没有意志力继续坚持下去了,暂 ...
leveldb源码分析--日志
我们知道在一个数据库系统中为了保证数据的可靠性,我们都会记录对系统的操作日志.日志的功能就是用来在系统down掉的时候对数据进行恢复,所以日志系统对一个要求可靠性的存储系统是极其重要的.接下来我们分析 ...
leveldb源码分析之Slice
转自:http://luodw.cc/2015/10/15/leveldb-02/ leveldb和redis这样的优秀开源框架都没有使用C++自带的字符串string,redis自己写了个sds,l ...
LevelDB源码分析--Cache及Get查找流程
本打算接下来分析version相关的概念,但是在准备的过程中看到了VersionSet的table_cache_这个变量才想起还有这样一个模块尚未分析,经过权衡觉得leveldb的version相对C ...
leveldb源码分析--SSTable之TableBuilder
上一篇文章讲述了SSTable的格式以后,本文结合源码解析SSTable是如何生成的. void TableBuilder::Add(const Slice& key, const Slice ...
leveldb源码分析之内存池Arena
转自:http://luodw.cc/2015/10/15/leveldb-04/ 这篇博客主要讲解下leveldb内存池,内存池很多地方都有用到,像linux内核也有个内存池.内存池的存在主要就是减 ...

随机推荐

Android 学习笔记 Service服务与远程通信...（AIDL）
PS:这一章节看的我有几分迷茫,不是很容易理解...不过还好总算是明白了一大半了...基本的迷惑是解决了... 学习内容: 1.跨应用启动服务... 2.跨应用绑定服务... 3.跨应用实现通信... ...
Django--models基础
需求了解models字段和参数速查 models.py 1 2 3 class UserInfo(models.Model): ctime = models.DateTimeField( ...
【转】Python中的GIL、多进程和多线程
转自:http://lesliezhu.github.io/public/2015-04-20-python-multi-process-thread.html 目录 1. GIL(Global In ...
[JS] JavaScript由浅入深(2) 进阶
本节,将围绕以下几点来讲. 知识点:多线程.作用域.闭包.this 先顶后看 1.多线程在不支持H5的浏览器中.使用Concurrent.Thread.js. 在支持H5中,使用WebWork. 在 ...
三分套三分 --- HDU 3400 Line belt
Line belt Problem's Link: http://acm.hdu.edu.cn/showproblem.php?pid=3400 Mean: 给出两条平行的线段AB, CD,然后一 ...
javascript运算符的优先级
最基木的运算符优先级就是所谓的“先乘除,后加减”.对于优先顺序处于同一层次上的运算符,按照从左到右出现的顺序计算.下面给出javascript定义的所有运算符的优先级.运算符优先顺序成员选择.括号. ...
Vs2012出现停止工作问题的解决方法
我的VS2012总是出现问题,打开项目会,更改移动控件位置也会,后来在网上找到了解决方法这是出现问题
AC自动机（1）
Description Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀). ...
[moka同学笔记]yii2 activeForm 表单样式的修改（二）
aaarticlea/png;base64,iVBORw0KGgoAAAANSUhEUgAABAEAAANXCAIAAADLkdErAAAgAElEQVR4nOzdfWwc953nef6zwO5Zg8
用C语言制作爱心
国庆我们实验室布置了作业,其中一项为,利用流程控制语句打印以下图形 * *** ***** ******* ***** *** * 代码如下 #include <stdio.h> int ...

leveldb源码分析--Iterator遍历数据库

leveldb源码分析--Iterator遍历数据库的更多相关文章

随机推荐

热门专题