最近正在学习linux下堆的管理机制，收集了书籍和网络上的资料，以自己的理解做了整理，做个记录。如果有什么不对的地方欢迎指出！

Memory Allocator

常见的内存管理机制

dlmalloc:通用分配器
ptmalloc2:glibc分配器，继承自dlmalloc，并提供了多线程支持，主要研究对象。
jemalloc:Firefox
tcmalloc:Chrome
其他：编程语言内存分配及回收，比如python
......

malloc工作机制

第一次调用malloc

内存分配机制

头文件：#include<unistd.h>

brk()

函数原型：int brk(void* end_data_segment)
功能和作用：用于设置program_break指向的位置。

sbrk()

函数原型：void* sbrk(intptr_t increment)
功能和作用：同brk()，参数可以是负数。执行成功返回上一次program_break的值，可以设置参数为0返回当前的program_break.

mmap()

功能和作用：当用户申请空间大于等于128kb，也就是0x20000字节时，不再使用brk()进行分配，改为使用mmap()。

unmmap()

功能和作用：堆mmap()申请的空间进行回收。

内存分配图

主线程的arena就是main_arena，包含start_brk和brk中间的连续内存，当main_arena不够分配时，会使用brk()进行扩展。
子线程arena可以有多片连续内存，但是大小是固定的，不可以扩展，如果不够用的话需要再次调用mmap()来分配。

第二次调用malloc

只要分配的空间不超过128kb，则不会再次向system申请空间，超过时才会调用brk()进行扩展。
即使将main_arena全部free，也不会立即把内存还给操作系统，此时内存由glib进行管理。

chunk

chunk时glibc管理内存的基本单元。主要分为以下几类：

alloced chunk：已分配正在使用中的chunk。
free chunk：已经free的chunk。
top chunk：可以理解为地址的最高处，还没有分配的chunk。
last remainder chunk：是为了提高内存分配的局部性。

chunk = chunk header + user data，malloc返回给用户的其实是user data指针，具体如下图：

alloced chunk结构

size：本chunk的大小，包括prev，大小为8的整数倍。32位以8字节对齐，最小为0x10。64位以16字节对齐，最小为0x20。其中低三位有特殊含义，分别为N、M、P
N位：是否属于主进程。
M位：是否由mmap()分配。
P位：前一堆块占用标志，1为占用，0为空闲。
当P位为0时，表示前一堆块释放，prev表示前一堆块的大小。当P位为1，表示前一堆块使用，prev表示前一堆块的数据。
userdata为输入的数据。
将下一堆块的P位设置为1。

free chunk

其中fd、bk属于链表指针，有特殊用途，后面会讲到。
prev_size为当前释放块的大小（包含chunk header）
下一堆块P位通常被设置为0（fastbin除外）。

top chcunk

该堆块位于前两种堆块之后，头部结构与alloced相似
size：top chunk还有多少空间可以分配。
重要的是P位：0表示上一堆块处于空闲，1表示上一堆块处于使用状态。主要用于判断free时是否能与上一堆块进行合并（fastbin除外）。

last remainder chunk

在malloc时，如果有比较大的chunk可以分配，会把这个chunk分成两部分，一部分返回给用户，另一部分称为remainder，加入到 unsorted bin，last remainder会记录最近拆分的remainder。这个remainder大小至少要为MINSIZE，否则不能拆分。
当下次malloc时，如果last remainder chunk够大，则重复上一过程。
拆分的情况：fast bin 和 small bin 都没有合适的chunk，同时unsorted bin有且只有一个可拆分的chunk，并且这个chunk 是last remainder。

堆空闲块管理结构bin

当alloced chunk被释放后，会根据大小放入bin或者合并到top chunk 中去。bin的主要作用时加快分配速度，通过链表方式（chunk中的fd和bk指针）进行管理。主要有以下几种，顾名思义：

fast bin
unsorted bin
small bin
large bin

fastbinsY：这是一个bin数组，里面有NFASTBINS个fast bin

bins：也是一个bin数组，一共有126个bin，按顺序分别是：

bin 1 为unsorted bin
bin 2 到 bin 63 为small bin
bin 64 到 bin 126 为 large bin

fast bin

这类bin通常申请和释放的堆块都比较小，所以使用单链表结构，LIFO（后进先出）分配策略。
为了速度，fast bin不会进行合并，下一个chunk始终处于使用状态。
在fastbinsY数组里按照从小到大的顺序排列。
以64位为例，fast bin结构如下（大小区间0x20_{0x80,32位为0x10}0x40）：

unsorted bin

一定大小堆块被释放时，在加入small bin 和large bin 之前，会首先加入此bin，可以加快分配速度。使用双链表结构，FIFO（先进先出）分配策略。
unsorted bin大小可能是不相同的。
由于使用双链表，一个bin会占用bins的两个元素。fd指向上一个chunk，bk指向下一个。
以64位为例，unsorted bin结构如下（非连续内存，大小无限制）：

small bin

同一个small bin里的chunk大小相同，使用双链表结构，FIFO（先进先出）分配策略。
由于fast bin和small bin 有重合部分，在某些情况下会加入到small bin
根据大小分成62个不同的bin，0x20,0x30,0x40...0x80,0x90...1008
以64位为例，small bin结构如下（大小区间：size<0x400byte）：

large bin

使用双链表结构，FIFO（先进先出）分配策略。
free时bk后面多两个此参数：fd_nextsize、bk_nextsize。分别指向前一个和后一个large chunk。
根据大小分成63个不同的bin，大小不再固定。前32个bin为 0x400+64i，32-48 bin为 0x1380+512j，依此类推。并且会将大的chunk放在前面，小的放在后面，以加快速度。
以64位为例，large bin大小区间：size>=1024byte。32位为：size>=512byte。
fd_nextsize和bk_nextsize指针用于指向第一个与自己大小不同的chunk，所以也只有在加入了大小不同的chunk时，这两个指针才会被修改。

随后附上glibc内存管理流程图

看不清楚可以保存下来放大。

Glibc堆管理机制基础的更多相关文章

Glibc堆块的向前向后合并与unlink原理机制探究
i春秋作家:Bug制造机原文来自:Glibc堆块的向前向后合并与unlink原理机制探究玩pwn有一段时间了,最近有点生疏了,调起来都不顺手了,所以读读malloc源码回炉一点一点总结反思下. U ...
Java基础-Java中的堆内存和离堆内存机制
Java基础-Java中的堆内存和离堆内存机制作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任.
Spring 框架基础(05)：事务管理机制，和实现方式
本文源码:GitHub·点这里 || GitEE·点这里一.Spring事务管理 1.基础描述 Spring事务管理的本质就是封装了数据库对事务支持的操作,使用JDBC的事务管理机制,就是利用jav ...
2万字|30张图带你领略glibc内存管理精髓(因为OOM导致了上千万损失)
前言大家好,我是雨乐. 5年前,在上家公司的时候,因为进程OOM造成了上千万的损失,当时用了一个月的时间来分析glibc源码,最终将问题彻底解决. 最近在逛知乎的时候,发现不少人有对malloc/f ...
Java虚拟机内存管理机制
自动内存管理机制 Java虚拟机(JVM)在执行Java程序过程中会把它所管理的内存划分为若干个不同的数据区域.这些区域都有各自的用途,以及创建和销毁的时间,有的区域随着虚拟机进程的启动而存在,有的区 ...
Windows编程中的堆管理（过于底层，一般不用关心）
摘要: 本文主要对Windows内存管理中的堆管理技术进行讨论,并简要介绍了堆的创建.内存块的分配与再分配.堆的撤销以及new和delete操作符的使用等内容. 关键词: 堆:堆管理 1 引言在大多 ...
IOS中内存管理机制浅解
我们知道在程序运行过程中要创建大量的对象,和其他高级语言类似,在ObjC中对象时存储在堆中的,系统并不会自动释放堆中的内存(注意基本类型是由系统自己管理的,放在栈上).如果一个对象创建并使用后没有得 ...
浅析java内存管理机制
内存管理是计算机编程中的一个重要问题,一般来说,内存管理主要包括内存分配和内存回收两个部分.不同的编程语言有不同的内存管理机制,本文在对比C++和Java语言内存管理机制的不同的基础上,浅析java中 ...
linux与C内存管理机制
转自知乎专栏:https://zhuanlan.zhihu.com/p/51855842?utm_source=wechat_session&utm_medium=social&utm ...

随机推荐

从微信小程序到鸿蒙js开发【04】——list组件
目录: 1.可滚动区域 2.list + list-item 3.list + list-item-group + list-item 1.可滚动区域在许多场景中,页面会有一块区域是可滚动的,比如这 ...
【uva 1152】4 Values Whose Sum is Zero（算法效率--中途相遇法+Hash或STL库）
题意:给定4个N元素几个A,B,C,D,要求分别从中选取一个元素a,b,c,d使得a+b+c+d=0.问有多少种选法.(N≤4000,D≤2^28) 解法:首先我们从最直接最暴力的方法开始思考:四重循 ...
hdu 2089不要62 (数位dp)
Problem Description 杭州人称那些傻乎乎粘嗒嗒的人为62(音:laoer). 杭州交通管理局经常会扩充一些的士车牌照,新近出来一个好消息,以后上牌照,不再含有不吉利的数字了,这样一来 ...
新疆大学ACM新生赛（公开赛） E.异或 (思维,位运算)
题意:RT 题解: \(i\ mod \ k=0\),即所有事\(k\)的倍数的位置都要进行异或,根据异或的性质,我们知道如果相同的异或的数个数是偶数的话,得出的结果是\(0\),所以每次询问,我们判 ...
Codeforces Global Round 9 C. Element Extermination (思维,栈)
题意:有一个长度\(n\)的序列,如果\(a_{i}<a_{i+1}\),那么可以选择删除\(a_{i}\)或者\(a_{i+1}\),再继续操作,问是否能够将序列删到只剩一个元素. 题解:感觉 ...
数位dp整理 && 例题HDU - 2089 不要62 && 例题 HDU - 3555 Bomb
数位dp: 数位dp是一种计数用的dp,一般就是要统计一个区间[li,ri]内满足一些条件数的个数.所谓数位dp,字面意思就是在数位上进行dp.数位的含义:一个数有个位.十位.百位.千位......数 ...
OpenStack Train版-14.安装块存储服务cinder（存储节点）
安装cindoer块存储服务节点(存储节点192.168.0.40)使用默认的LVM卷方法,之后改为ceph存储安装LVM软件包 [root@cinder01 ~]# yum install lvm ...
Jenkins管理员密码忘记修改操作
一.Jenkins管理员密码忘记当jenkins忘记了管理用户的密码时,只能通过修改配置文件并重启的方式初始化设置用户名及密码,操作如下: [root@localhost jenkins]# vim ...
codeforces 1010 C. Border【exgcd】
题目链接:戳这里学习博客:戳这里题意:给n种数,n种数取任意个任意组合相加为sum,求sum%k有哪些值. 解题思路: 由exgcd可知(具体用到的是贝祖定理),ax + by = c,满足gcd ...
洛谷p2216 多次单调队列，扫描矩阵中的最大值减去最小值最的固定大小子矩阵
#include <iostream> #include <cstdio> #include <cstring> using namespace std; int ...

Glibc堆管理机制基础