leveldb源码分析之内存池Arena
转自:http://luodw.cc/2015/10/15/leveldb-04/
这篇博客主要讲解下leveldb内存池,内存池很多地方都有用到,像linux内核也有个内存池。内存池的存在主要就是减少malloc或者new调用的次数,较少内存分配所带来的系统开销。
Arena类采用vector来存储每次分配内存的指针,每一次分配的内存,我们称为一个块block。block默认大小为4096kb。我们可以先看下Arena的模型:
我们来看看源码: 首先看下这个类的几个成员变量:
1
2
3
4
|
char* alloc_ptr_;//内存的偏移量指针,即指向未使用内存的首地址
size_t alloc_bytes_remaining_;//还剩下的内存数
std::vector<char*> blocks_;//存储每一次分配的内存指针
size_t blocks_memory_;//到目前为止分配的总内存。
|
构造函数和析构函数:
1
2
3
4
5
6
7
8
9
10
11
12
|
Arena::Arena() {
blocks_memory_ = 0;
alloc_ptr_ = NULL; // First allocation will allocate a block
alloc_bytes_remaining_ = 0;
}//构造函数初始化总总分配的内存为0,指针偏移量为NULL,剩余内存为0。
vector会调用默认构造函数初始化。
Arena::~Arena() {
for (size_t i = 0; i < blocks_.size(); i++) {
delete[] blocks_[i];
}
}//Arena析构时,只需要把所有的指针指向的内存都delete就可以了。
|
都说谷歌的C++编程风格是最优美的。leveldb里面的每个类的构造函数都直接初始化所有的属性,这样就不会导致使用为初始化的变量,而且代码很清晰,知道哪些属性被初始化为何值。
接下来分析下Arena内存分配的主要函数。
1
2
3
4
5
|
public:
char* Allocate(size_t bytes);
private:
char* AllocateFallback(size_t bytes);
char* AllocateNewBlock(size_t block_bytes);
|
Arena对外提供的接口是public里的函数,但是该函数会调用private里的两个函数.我分析内存分配策略。当要分配内存的时候:
- 如果需求的内存小于剩余的内存,那么直接在剩余的内存分配就可以了;
- 如果需求的内存大于剩余的内存,而且大于4096/4,则给这内存单独分配一块bytes(函数参数)大小的内存。
- 如果需求的内存大于剩余的内存,而且小于4096/4,则重新分配一个内存块,默认大小4096,用于存储数据。
针对第二点,按源码的注释是说避浪费太多的剩余空间。我的理解是,如果剩余的内存为1500kb,那么假设有一个内存需求是500kb,一个内存需求是1500kb,则第一个需求可以使用三次才导致进行一次重新内存分配,而第二个只能使用一次就要进行一次重新内存分配。所以leveldb第二条的用意主要还是减少内存分配的次数。
源码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
|
inline char* Arena::Allocate(size_t bytes) {
// The semantics of what to return are a bit messy if we allow
// 0-byte allocations, so we disallow them here (we don't need
// them for our internal use).
assert(bytes > 0);
if (bytes <= alloc_bytes_remaining_) {//需要的内存小于剩余的内存,直接分配,
//移动指针偏移量,减少剩余内存,返回刚分配内存的首位置
char* result = alloc_ptr_;//先保存指针偏移量,用于返回
alloc_ptr_ += bytes;//指针偏移量向上移动bytes个字节
alloc_bytes_remaining_ -= bytes;//剩余内存减少bytes个字节
return result;
}
return AllocateFallback(bytes);//当需求内存大于剩余内存时
}
char* Arena::AllocateFallback(size_t bytes) {
if (bytes > kBlockSize / 4) {//需求内存大于1024kb时
// Object is more than a quarter of our block size. Allocate it separately
// to avoid wasting too much space in leftover bytes.
char* result = AllocateNewBlock(bytes);
return result;
}
// We waste the remaining space in the current block.
alloc_ptr_ = AllocateNewBlock(kBlockSize);//需求内存大于剩余内存,且小于1024时。
alloc_bytes_remaining_ = kBlockSize;
char* result = alloc_ptr_;
alloc_ptr_ += bytes;
alloc_bytes_remaining_ -= bytes;
return result;
}
char* Arena::AllocateNewBlock(size_t block_bytes) {
char* result = new char[block_bytes];//分配内存
blocks_memory_ += block_bytes;//总的内存加上刚分配的内存
blocks_.push_back(result);//添加进内存指针数组
return result;
}
|
arena还提供了字节对齐内存分配,一般情况是8个字节对齐分配,即内存地址后三位必须为0.我们来看下源码,挺多学问的。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
char* Arena::AllocateAligned(size_t bytes) {
//用于判断对齐的大小,我64位电脑sizeof(void*)=8,不大于8,所以对齐大小为8。
const int align = (sizeof(void*) > 8) ? sizeof(void*) : 8;
//用于判断align是否为2的次幂,内存对齐肯定是2的次幂。
assert((align & (align-1)) == 0);
//判断当前的模式,align-1后三位为1,其他都为0,所以指针与align-1做与运算,
//其实就是指针与align求余运算。例如如果地址值为9,9&7,则最后一位为1,9%8=1。
size_t current_mod = reinterpret_cast<uintptr_t>(alloc_ptr_) & (align-1);
//根据当前的模式,算出需要添加的字节数
size_t slop = (current_mod == 0 ? 0 : align - current_mod);
size_t needed = bytes + slop;//原来需求的字节大小,加上为了对齐补充的字节大小
char* result;
if (needed <= alloc_bytes_remaining_) {
result = alloc_ptr_ + slop;
alloc_ptr_ += needed;
alloc_bytes_remaining_ -= needed;
} else {
// AllocateFallback always returned aligned memory
result = AllocateFallback(bytes);
}
assert((reinterpret_cast<uintptr_t>(result) & (align-1)) == 0);
return result;
}
|
这里边有一个uintptr_t类型,定义在<stddef.h>头文件里,是无符号长整形类型,是typedef unsigned long int 类型,对应有符号类型为typedef long int intptr_t。这种类型是机器指针大小对应,如果32位系统,则uintptr_t也为32位,如果是64位系统,则这个值为64位。
Arena最后一个对外接口是返回这个内存池分配总的内存大小。
1
2
3
|
size_t MemoryUsage() const {
return blocks_memory_ + blocks_.capacity() * sizeof(char*);
}
|
Arena内存大小包括分配的内存空间大小和所有指针大小之和。
Arena在memtabla(也就是跳跃链表)使用较多,因为刚插入的内存数据都放在了memtable里。
至此Arena就分析结束了。
leveldb源码分析之内存池Arena的更多相关文章
- STL源码分析之内存池
前言 上一节只分析了第二级配置器是由多个链表来存放相同内存大小, 当没有空间的时候就向内存池索取就行了, 却没有具体分析内存池是怎么保存空间的, 是不是内存池真的有用不完的内存, 本节我们就具体来分析 ...
- Leveldb源码分析--1
coming from http://blog.csdn.net/sparkliang/article/details/8567602 [前言:看了一点oceanbase,没有意志力继续坚持下去了,暂 ...
- netty源码分析 - Recycler 对象池的设计
目录 一.为什么需要对象池 二.使用姿势 2.1 同线程创建回收对象 2.2 异线程创建回收对象 三.数据结构 3.1 物理数据结构图 3.2 逻辑数据结构图(重要) 四.源码分析 4.2.同线程获取 ...
- v76.01 鸿蒙内核源码分析(共享内存) | 进程间最快通讯方式 | 百篇博客分析OpenHarmony源码
百篇博客分析|本篇为:(共享内存篇) | 进程间最快通讯方式 进程通讯相关篇为: v26.08 鸿蒙内核源码分析(自旋锁) | 当立贞节牌坊的好同志 v27.05 鸿蒙内核源码分析(互斥锁) | 同样 ...
- Memcached源码分析之内存管理
先再说明一下,我本次分析的memcached版本是1.4.20,有些旧的版本关于内存管理的机制和数据结构与1.4.20有一定的差异(本文中会提到). 一)模型分析在开始解剖memcached关于内存管 ...
- leveldb源码分析--SSTable之block
在SSTable中主要存储数据的地方是data block,block_builder就是这个专门进行block的组织的地方,我们来详细看看其中的内容,其主要有Add,Finish和CurrentSi ...
- leveldb源码分析--WriteBatch
从[leveldb源码分析--插入删除流程]和WriteBatch其名我们就很轻易的知道,这个是leveldb内部的一个批量写的结构,在leveldb为了提高插入和删除的效率,在其插入过程中都采用了批 ...
- leveldb源码分析--Key结构
[注]本文参考了sparkliang的专栏的Leveldb源码分析--3并进行了一定的重组和排版 经过上一篇文章的分析我们队leveldb的插入流程有了一定的认识,而该文设计最多的又是Batch的概念 ...
- LevelDB源码分析之:arena内存管理
一.原理 arena是LevelDB内部实现的内存池. 我们知道,对于一个高性能的服务器端程序来说,内存的使用非常重要.C++提供了new/delete来管理内存的申请和释放,但是对于小对象来说,直接 ...
随机推荐
- (六)lucene之其他查询方式(组合查询,制定数字范围、指定字符串开头)
本章使用的是lucene5.3.0 指定数字范围查询 package com.shyroke.test; import java.io.IOException; import java.nio.fil ...
- C++虚函数【Java有虚函数吗?】
1,简单介绍 定义在基类中的函数,子类必须对其进行覆写![必须对其进行覆写?!]——Java中的接口.Abstract方法中的抽象类也有这样的要求. C++中定义: virtual void deal ...
- Eureka服务注册于发现之Client搭建
Eureka在Server端的搭建已经有很多介绍的文章,同时也是学习Eureka的第一步. 搭建好注册中心后怎么进行服务注册和服务调用,是我们要讲的主要内容. 开发环境:IDEA2018.3+Spri ...
- vue+scss动态改变主题颜色
1.新建.scss后缀公用文件,放在assets或者其他地方都可以 /*需要切换的颜色变量*/ $color-primary1:#1776E1; /* 更换的颜色 */ $color-primary2 ...
- 根据导入xlxs的文件,来写入数据库
今天讲解一下上传文件.前台必须保持传参类型"multipart/form-data" 后台可以设定 public static final String MULTIPART_FOR ...
- 2019年Java后端工程师常见面试题和感想
来新公司有5个月了,从第二个月开始就参与公司后端工程师的面试工作了,包括校招在内,面试超过100个(包括40个校招的终面)应聘者了,应聘者中有超过10年的技术经理,有6年以上的高级开发,有3到5年的中 ...
- 数据库(sql server 2000)—— 学习笔记1
一.安装 安装程序一般都是四合一的,SQL Server 2000有四个版本:企业版.标准版.个人版.开发版,每个版本的对系统的要求各不相同. SQL Server 2000各版本 对 操作系统的要求 ...
- TreeMap源码实现类中文全解析
/** * 基于红黑树(Red-Black tree)的 NavigableMap 实现.该映射根据其键的自然顺序进行排序, * 或者根据创建映射时提供的Comparator 进行排序,具体取决于使用 ...
- 6.Java集合-LinkedList实现原理及源码分析
Java中LinkedList的部分源码(本文针对1.7的源码) LinkedList的基本结构 jdk1.7之后,node节点取代了 entry ,带来的变化是,将1.6中的环形结构优化为了直线型链 ...
- Sqlmap对dvwa进行sql注入测试
前提准备条件: 1.下载安装dvwa,下载链接地址:http://www.dvwa.co.uk/.2.需要安装python运行环境.3.下载sqlmap包并将其解压. 一.查看所有的数据库;(其中db ...