LevelDB学习笔记 (1):初识LevelDB

1. 写在前面

1.1 什么是levelDB

LevelDB就是一个由Google开源的高效的单机Key/Value存储系统,该存储系统提供了Key到Value的有序映射。

地址: https://github.com/google/leveldb

中文文档: https://kevins.pro/leveldb_chinese_doc.html

1.2 为什么要学levelDB

学习源码算是一种很好的学习方式,准备精读几个经典的开源代码,那学习levelDB的原因主要有下

  1. 谷歌开源,代码质量非常高,而且只有1w行(去掉测试代码)不是过于复杂
  2. 现在主流的kv存储系统有很多基于levelDB或者借鉴了levelDB的思想

2. Linux/Mac下的编译运行

1. Quick start

下面来自于官方文档

mkdir -p build && cd build
cmake -DCMAKE_BUILD_TYPE=Release .. && cmake --build . #release版本
cmake -DCMAKE_BUILD_TYPE=Debug .. && cmake --build . #debug版本

在类linux系统下编译非常简单,上面两行就可以了

不过这里编译可能会遇到一些问题

比如我遇到了上面的问题,这是因为在third_party这个文件夹内缺少googletest和benchmark。

这里手动下载一下这两个文件把这个目录下的空文件替换了就好了。然后在执行cmake即可

benchmark

googletest

上面是对应的github地址,直接点进去git clone就行,当然最近的github好像git clone总是出问题,我是直接下载zip然后替换过去的。

2. Quick test

新建一个文件夹叫my_test。添加一个新的cpp文件run_test.cpp

随后修改CMakeList.txt里添加关于新测试文件的规则。就可以了

我们准备写一个运行的测试文件,来创建一个db,随后进行添加和删除数据

#include <iostream>
#include <cassert>
#include "leveldb/db.h"
#include "leveldb/write_batch.h"
int main()
{
// Open a database.
leveldb::DB* db;
leveldb::Options opts;
opts.create_if_missing = true;
leveldb::Status status = leveldb::DB::Open(opts, "../tmp/testdb", &db);
assert(status.ok()); // Write data.
status = db->Put(leveldb::WriteOptions(), "name", "zxl");
assert(status.ok()); // Read data.
std::string val;
status = db->Get(leveldb::ReadOptions(), "name", &val);
assert(status.ok());
std::cout << val << std::endl;
}

上面的代码就是我们在tmp文件下创建一个testdb。然后写入一条数据 key = "name" value = "zxl"。这个时候我们执行get操作就会得到我们刚才写入的值

3. LevelDB的基本操作

关于数据库的创建以及读写操作我们上面以及提过了

3.1 原子更新-Atomic Updates

下面的例子来自官方文档

考虑下面这一种情况,假如进程在Put key2 和 Delete key1两个操作之间结束,那么key1和key2这两个不同的键值将存储相同的值,这和我们的意愿相违背。为了避免这种情况的出现,leveldb利用WriteBatch来进行具有原子性的更新。

td::string value;
leveldb::Status s = db->Get(leveldb::ReadOptions(), key1, &value);
if (s.ok()) s = db->Put(leveldb::WriteOptions(), key2, value);
if (s.ok()) s = db->Delete(leveldb::WriteOptions(), key1);
#include "leveldb/write_batch.h"
...
std::string value;
leveldb::Status s = db->Get(leveldb::ReadOptions(), key1, &value);
if (s.ok()) {
leveldb::WriteBatch batch;
batch.Delete(key1);
batch.Put(key2, value);
s = db->Write(leveldb::WriteOptions(), &batch);
}

WriteBatch对象保存对数据库进行的一系列操作,然后在这一批次中按照顺序执行这些操作。

注意:这里先进行Delete操作,然后再进行Put操作。

WriteBatch类除了原子性的优势外,也可以用于通过将大量个体变动放置在同一批次中而加速批量更新。

3.2 迭代 - Iteration

下面的例子来自官方文档

下面的例子演示了如何从数据库中成对的打印键值:

leveldb::Iterator* it = db->NewIterator(leveldb::ReadOptions());
for (it->SeekToFirst(); it->Valid(); it->Next()) {
cout << it->key().ToString() << ": " << it->value().ToString() << endl;
}
assert(it->status().ok()); // Check for any errors found during the scan
delete it;

下面的修改后的例子演示了如何仅获取[start, limit)范围内的键;

for (it->Seek(start);
it->Valid() && it->key().ToString() < limit;
it->Next()) {
...
}

还可以通过相反的顺序进行处理。(警告:反向迭代比正向迭代慢一些)

for (it->SeekToLast(); it->Valid(); it->Prev()) {
...
}

好下面结合迭代和刚才学到的原子更新自己写一个测试文件

  1. 顺序全体迭代
 // test Atomic Updates
leveldb::WriteBatch batch;
batch.Delete("name");
batch.Put("name0", "zxl0");
batch.Put("name1", "zxl1");
batch.Put("name2", "zxl2");
status = db->Write(leveldb::WriteOptions(), &batch);
assert(status.ok());
//Scan database.
leveldb::Iterator *it = db->NewIterator(leveldb::ReadOptions());
for (it->SeekToFirst(); it->Valid(); it->Next()) {
std::cout << it->key().ToString() << ": " <<
it->value().ToString() << std::endl;
}
assert(it->status().ok());

这段代码就会输出我们写入的三个k-v对

2. range 迭代

  for (it->Seek("name1"); it->Valid() && it->key().ToString() < "name2"; it->Next()) {
std::cout << it->key().ToString() << ": " <<
it->value().ToString() << std::endl;
}
delete it;

只会输出key值位于[name1,"name2")之间的value也就只输出了key=name1的value

当然还有其他的基本操作,但是这里我们展示了增删改查已经足够了.后面会在梳理具体实现的时候在增加新的测试文件

LevelDB学习笔记 (1):初识LevelDB的更多相关文章

  1. LevelDB学习笔记 (3): 长文解析memtable、跳表和内存池Arena

    LevelDB学习笔记 (3): 长文解析memtable.跳表和内存池Arena 1. MemTable的基本信息 我们前面说过leveldb的所有数据都会先写入memtable中,在leveldb ...

  2. LevelDB 学习笔记1:布隆过滤器

    LevelDB 学习笔记1:布隆过滤器 底层是位数组,初始都是 0 插入时,用 k 个哈希函数对插入的数字做哈希,并用位数组长度取余,将对应位置 1 查找时,做同样的哈希操作,查看这些位的值 如果所有 ...

  3. LevelDB 学习笔记2:合并

    LevelDB 学习笔记2:合并 部分图片来自 RocksDB 文档 Minor Compaction 将内存数据库刷到硬盘的过程称为 minor compaction 产出的 L0 层的 sstab ...

  4. Storm学习笔记 - Storm初识

    Storm学习笔记 - Storm初识 1. Strom是什么? Storm是一个开源免费的分布式计算框架,可以实时处理大量的数据流. 2. Storm的特点 高性能,低延迟. 分布式:可解决数据量大 ...

  5. Java学习笔记心得——初识Java

    初识Java 拿到这本厚厚的<Java学习笔记>,翻开目录:Java平台概论.从JDK到TDE.认识对象.封装.继承与多态...看着这些似懂非懂的术语名词,心里怀着些好奇与担忧,就这样我开 ...

  6. leveldb 学习笔记之VarInt

    在leveldb在查找比较时的key里面保存key长度用的是VarInt,何为VarInt呢,就是变长的整数,每7bit代表一个数,第8bit代表是否还有下一个字节, 1. 比如小于128(一个字节以 ...

  7. leveldb学习笔记

    LevelDB由 Jeff Dean和Sanjay Ghemawat开发. LevelDb是能够处理十亿级别规模Key-Value型数据持久性存储的C++ 程序库. 特别如下: 1.LevelDb是一 ...

  8. LevelDB学习笔记 (2): 整体概览与读写实现细节

    1. leveldb整体介绍 首先leveldb的数据是存储在磁盘上的.采用LSM-Tree实现,LSM-Tree把对于磁盘的随机写操作转换成了顺序写操作.这是得益于此leveldb的写操作非常快,为 ...

  9. leveldb 学习笔记之log结构与存取流程

    log文件的格式 log文件每一条记录由四个部分组成: CheckSum,即CRC验证码,占4个字节 记录长度,即数据部分的长度,2个字节 类型,这条记录的类型,后续讲解,1个字节 数据,就是这条记录 ...

随机推荐

  1. Java虚拟机栈和PC寄存器

    PC Register介绍 JVM中的程序计数寄存器(Program Counter Register)中,Register 的命名源于CPU的寄存器,寄存器存储指令相关的现场信息.CPU只有把数据装 ...

  2. 【vue2】(一)基础使用

    [vue2](一)基础使用 MVVM MVVM: View - Model - ViewModel View: Dom层,视图层 Model: Plain JavaScript Objects,数据层 ...

  3. 【Web前端HTML5&CSS3】06-盒模型

    笔记来源:尚硅谷Web前端HTML5&CSS3初学者零基础入门全套完整版 目录 盒模型 1. 文档流(normalflow) 2. 块元素 3. 行内元素 4. 盒子模型 盒模型.盒子模型.框 ...

  4. 【BIGDATA】在Centos上部署ElasticSearch 7.3.2及kibana

    一.下载: 首先,下载ElasticSearch和kibana安装包,版本自选,官方下载页https://www.elastic.co/cn/downloads/ 二.版本检查 很重要的一步,要检查C ...

  5. openstack创建vlan网络并配置网络设备

    1.在管理员-->网络-->创建网络. 2.填写网络信息,这里要划分新的VLAN,注意在物理网络中填写的事VLAN,段ID指的是vlan的id 3.创建的网络. 4.创建子网,在里面修改子 ...

  6. ELK日志收集分析平台部署使用

    一.ELK介绍 开源实时日志分析ELK平台能够完美的解决我们上述的问题,ELK由ElasticSearch.Logstash和Kiabana三个开源工具组成: 1.ElasticSearch是一个基于 ...

  7. IT菜鸟之路由器基础配置(静态、动态、默认路由)

    路由器:连接不同网段的设备 企业级路由和家用级路由的区别: 待机数量不同(待机量) 待机量:同时接通的终端设备的数量 待机量的值越高,路由的性能越好 别墅级路由,表示信号好,和性能无关 交换机:背板带 ...

  8. DOCKER学习_016:Docker镜像仓库和HARBOR的简单安装和管理

    一 镜像仓库介绍 1.1 简介 镜像仓库用于存放 Docker镜像 Docker registry提供镜像仓库服务 一个 Docker registry可以包含多个镜像仓库 仓库分为公共镜像仓库与私有 ...

  9. Linux进阶之VMware Linux虚拟机运行提示“锁定文件失败 虚拟机开启模块snapshot失败”的解决办法

    问题1:VMware Linux虚拟机运行提示"锁定文件失败 虚拟机开启模块snapshot失败"的解决办法 非正常关闭虚拟机(例如开关机过程中关掉VMware等操作),再次启动虚 ...

  10. Python数学建模-01.新手必读

    Python 完全可以满足数学建模的需要. Python 是数学建模的最佳选择之一,而且在其它工作中也无所不能. 『Python 数学建模 @ Youcans』带你从数模小白成为国赛达人. 1. 数学 ...