leveldb的缓存机制

leveldb采用LRU机制, 利用键的哈希值前n位作为索引, 将要插入的键值对分派到指定的缓存区, 当缓存区的使用率大于总容量后, 优先淘汰最近最少使用的缓存, 独立的缓存区总量为2^n .

初始化ShardedLRUCache

  • 设置初始缓存容量, 并设置16个子分区的容量.

    1. static const int kNumShardBits = 4;
    2. static const int kNumShards = 1 << kNumShardBits;
    3. explicit ShardedLRUCache(size_t capacity)
    4. : last_id_(0) {
    5. const size_t per_shard = (capacity + (kNumShards - 1)) / kNumShards;
    6. for (int s = 0; s < kNumShards; s++) {
    7. shard_[s].SetCapacity(per_shard);
    8. }
    9. }

新建缓存

  • 由key的hash值的前kNumShardBits位作为子缓存区索引, 默认为前4位的索引位, 索引到指定的区, 子缓存区LRUCache接管新建缓存的任务.

    1. class ShardedLRUCache : public Cache {
    2. ...
    3. virtual Handle* Insert(const Slice& key, void* value, size_t charge,
    4. void (*deleter)(const Slice& key, void* value)) {
    5. const uint32_t hash = HashSlice(key);
    6. return shard_[Shard(hash)].Insert(key, hash, value, charge, deleter);
    7. }
  • LRUCache结构

    1. // A single shard of sharded cache.
    2. class LRUCache {
    3. public:
    4. LRUCache();
    5. ~LRUCache();
    6. // Separate from constructor so caller can easily make an array of LRUCache
    7. void SetCapacity(size_t capacity) { capacity_ = capacity; }
    8. // Like Cache methods, but with an extra "hash" parameter.
    9. Cache::Handle* Insert(const Slice& key, uint32_t hash,
    10. void* value, size_t charge,
    11. void (*deleter)(const Slice& key, void* value));
    12. Cache::Handle* Lookup(const Slice& key, uint32_t hash);
    13. void Release(Cache::Handle* handle);
    14. void Erase(const Slice& key, uint32_t hash);
    15. private:
    16. void LRU_Remove(LRUHandle* e);
    17. void LRU_Append(LRUHandle* e);
    18. void Unref(LRUHandle* e);
    19. // Initialized before use.
    20. size_t capacity_;
    21. // mutex_ protects the following state.
    22. port::Mutex mutex_;
    23. size_t usage_;
    24. // Dummy head of LRU list.
    25. // lru.prev is newest entry, lru.next is oldest entry.
    26. LRUHandle lru_;
    27. HandleTable table_;
    28. };

    LRUCache才是真正具有缓存功能的结构, capacity_表示它的最大容量, mutex_规范各线程互斥地访问, usage_标志缓存中已用容量, lru_作为哑节点, 它的前节点是最新的缓存对象, 它的后节点是最老的缓存对象, table_是用来统计对象是否被缓存的哈希表.

  • LRUCache缓存生成

    1. 缓存的基础节点是LRUHandle, 储存节点的(键, 值, 哈希值, next, prev节点, 销毁处理函数等)信息. 综合上面的LRUCache结构也看到, 实际上, 缓存节点是双向列表存储, LRUHandle lru_这个哑节点用来分隔最常更新的节点和最不常更新节点.

    2. 当要将缓存节点插入缓存区, 先由哈希表判断缓存是否已存在, 若存在, 将其更新至最常更新节点; 若不存在, 则插入为最常更新节点. 同时更新哈希表HandleTable table_.

    3. 这里的HandleTable实现并没特殊之处, 我看是采用键哈希策略进行哈希, 如果键冲突则以链表进行存储:

    4. 利用二级指针对链表进行插入.

      1. LRUHandle* Insert(LRUHandle* h) {
      2. LRUHandle** ptr = FindPointer(h->key(), h->hash);
      3. LRUHandle* old = *ptr;
      4. h->next_hash = (old == NULL ? NULL : old->next_hash);
      5. *ptr = h;
      6. if (old == NULL) {
      7. ++elems_;
      8. if (elems_ > length_) {
      9. // Since each cache entry is fairly large, we aim for a small
      10. // average linked list length (<= 1).
      11. Resize();
      12. }
      13. }
      14. return old;
      15. }
  • 二级指针

    在HandleTable这个哈希表实现里, 有个FindPointer方法用来查找此对象是否已存在, 并返回LRUHandle**, 代码如下:

    1. // Return a pointer to slot that points to a cache entry that
    2. // matches key/hash. If there is no such cache entry, return a
    3. // pointer to the trailing slot in the corresponding linked list.
    4. LRUHandle** FindPointer(const Slice& key, uint32_t hash) {
    5. LRUHandle** ptr = &list_[hash & (length_ - 1)];
    6. while (*ptr != NULL &&
    7. ((*ptr)->hash != hash || key != (*ptr)->key())) {
    8. ptr = &(*ptr)->next_hash;
    9. }
    10. return ptr;
    11. }

    可见, 如果已存在节点, 则返回这个节点的LRUHandle**; 如果不存在, 返回的是可以保存这个LRUHandle*的地址.

  • LRUCache缓存查找

    如果缓存存在, 则将其放置到哑节点lru_的prev位置, 即最近使用节点, 相当于提升它的优先级, 便于下次快速查找; 如果不存在这个缓存, 返回NULL.

小结

看完leveldb的缓存实现, 在实现思路上, 是传统的lru算法, 使用哈希表判重, 根据缓存的请求时间提升缓存的优先级. 里面的细节例如使用哈希值的前n位进行路由, 路由到2^n 个独立的缓存区, 各个缓存区维护自己的mutex进行并发控制; 哈希表在插入节点时判断空间使用率, 并进行自动扩容, 保证查找效率在O(1).

levelDB缓存实现的更多相关文章

  1. MyCat源码分析系列之——BufferPool与缓存机制

    更多MyCat源码分析,请戳MyCat源码分析系列 BufferPool MyCat的缓冲区采用的是java.nio.ByteBuffer,由BufferPool类统一管理,相关的设置在SystemC ...

  2. leveldb 性能、使用场景评估

    最近有个业务写远远大于读,读也集中在最近写入,这不很适合采用leveldb存储么,leveldb业界貌似ssdb用得挺广,花了两天时间就ssdb简单做下测试,以下总结. ssdb 是leveldb的r ...

  3. 大型web系统数据缓存设计

    1. 前言 在高访问量的web系统中,缓存几乎是离不开的:但是一个适当.高效的缓存方案设计却并不容易:所以接下来将讨论一下应用系统缓存的设计方面应该注意哪些东西,包括缓存的选型.常见缓存系统的特点和数 ...

  4. LevelDB库简介

    LevelDB库简介 一.LevelDB入门 LevelDB是Google开源的持久化KV单机数据库,具有很高的随机写,顺序读/写性能,但是随机读的性能很一般,也就是说,LevelDB很适合应用在查询 ...

  5. HBase、Redis、MongoDB、Couchbase、LevelDB主流 NoSQL 数据库的对比

    最近小组准备启动一个 node 开源项目,从前端亲和力.大数据下的IO性能.可扩展性几点入手挑选了 NoSql 数据库,但具体使用哪一款产品还需要做一次选型. 我们最终把选项范围缩窄在 HBase.R ...

  6. 161104、NoSQL数据库:key/value型之levelDB介绍及java实现

    简介:Leveldb是一个google实现的非常高效的kv数据库,能够支持billion级别的数据量了. 在这个数量级别下还有着非常高的性能,主要归功于它的良好的设计.特别是LSM算法.LevelDB ...

  7. [转载] leveldb日知录

    原文: http://www.cnblogs.com/haippy/archive/2011/12/04/2276064.html 对leveldb非常好的一篇学习总结文章 郑重声明:本篇博客是自己学 ...

  8. 关于时间序列数据库的思考——(1)运用hash文件(例如:RRD,Whisper) (2)运用LSM树来备份(例如:LevelDB,RocksDB,Cassandra) (3)运用B-树排序和k/v存储(例如:BoltDB,LMDB)

    转自:http://0351slc.com/portal.php?mod=view&aid=12 近期网络上呈现了有关catena.benchmarking boltdb等时刻序列存储办法的介 ...

  9. Leveldb 实现原理

    原文地址:http://www.cnblogs.com/haippy/archive/2011/12/04/2276064.html LevelDb日知录之一:LevelDb 101 说起LevelD ...

随机推荐

  1. 使用SWFUpload插件上传文件

    演示代码由两部分组成,包括前台文件和后台文件: 1.前台文件index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transi ...

  2. android和Vitamio使用比较

    在开始接触udp组播的时候先使用的Vitamio,播放时候声音卡顿 画面也会出现卡顿,后来又使用了VLC,画面挺好,,但是声音卡顿.最后不断测试发现是由于设备底层驱动处理视频部分有问题,导致程序播出的 ...

  3. php保留小数格式的多种方法

    php保留小数格式,定义小数格式,小数点,位数,小数位数: 方法一:(推荐)bcmul(1000.90,1,2);//两个数相乘1000.90*1, 保留两位小数点(无四舍五入)<返回strin ...

  4. [cpp]伯乐在线编程挑战第 0 期 – 呼叫转移系统

    题目: 描述 呼叫转移服务是一个把呼叫号码A转移到号码B的服务.举个例子:当你正在度假时,这样的系统非常有帮助.A君度假去了,那么,A君的工作电话可以通 过呼叫转移至B君.更进一步讲,当B君也正好在度 ...

  5. Mysql文件太大导入失败解决办法总结

    Mysql文件太大导入失败解决办法总结 在使用phpmyadmin导入数据库的时候可能会碰到由于数据库文件太大而无法导入的问题! 英文提示如下:File exceeds the maximum all ...

  6. Apple Catching(dp)

    Apple Catching Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 9831   Accepted: 4779 De ...

  7. linux内核源码阅读之facebook硬盘加速flashcache之四

    这一小节介绍一下flashcache读写入口和读写的基础实现. 首先,不管是模块还是程序,必须先找到入口,用户态代码会经常去先看main函数,内核看module_init,同样看IO流时候也要找到入口 ...

  8. iOS中Block介绍(一)基础

    ios开发block的使用指南,以及深入理解block的内存管理,也适用于osx开发.讨论范围:block的使用,内存管理,内部实现.不包含的内容:gc arc下的block内存,block在c++中 ...

  9. 开启新的activity获取它的返回值

    1.开始界面 <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" xmlns:t ...

  10. result 相关

    1.dispatcher 2.redirect 3.chain 4.redirectAction 5.freemarker 6.httpheader 7.stream 8.velocity 9.xsl ...