Redis设计与实现-内部数据结构篇
题记:这本书是2015年11月份开始读的,大约花了一个多月的时间通读了一遍,最近由于需要对redis做一些深入的了解,因此又花了两个多月仔细精读了一遍,由于本书设计的内容较多,且每部分的内容都比较细致,因此在整理读书笔记的时候花了很多时间,但确实也收获了很多,本书是针对redis底层的数据结构部分做的整理。 -----Dimmacro 2016年11月7日18:21:54。
我们知道redis可以存储字符串、列表、哈希对象、集合、有序集合等五种对象类型,但是在redis内部,根据不同对象类型的数据特点,有对应的数据结构作为其底层的存储结构,而且即使是同一对象类型,当数据量或数据大小不同时,为了提供更好的性能及减少内存使用率,也会切换不同的底层数据结构。因此了解这些底层数据结构对我们深入了解redis分布式缓存有非常重要的帮助。
- redis是键值对数据库,每个键都是字符串对象,而值可以是字符串对象,列表对象,哈希对象,集合对象,有序集合对象五种之一;
- redis使用sds(simple dynamic string)简单动态字符串来表示最基本的字符串数据,该结构记录了用于保存字符串的字节数组char buf[]、已使用长度int len和未使用长度int free。有点类似于java中的String对象。
- 此sds利用c字符串作为字面量,并遵循以空字符'\0'作为字符串末尾的C风格,使得其可以直接重用C字符串函数库的部分函数,但相比较于C字符串有以下优点:
- 直接保存字符串长度而不是像C那样需要遍历才能获取长度;
- 通过空间预分配及惰性空间释放来减少由于修改字符串带来的内存重分配。空间预分配是指:当需要扩展字符数组容量时,如果分配后的长度将小于1MB,那么会预分配与当前len长度一样的字节量,如果超过1MB,则会分配1MB。惰性空间释放是指:当缩短sds字符串时,多余出来的字节数组并不回收,而是通过增长free记录起来,这样下次当需要增长到时候如果free本身就够用了,就不需要申请内存了。当然,也有API可调用来主动释放。
- 使用二进制方式处理buf数组,保持二进制数据,因此可以保存除文本数据外的其他格式,如图片,音视频,压缩文件等;
(二)数据结构部分-链表linkedlist
- 链表通过高效的节点重排、顺序访问、增删节点灵活调整期长度等特点,应用于redis中的列表键、发布与订阅、慢查询、监视器等;
- 链表的数据结构:表头head、表尾tail、节点数量即长度len、节点值复制函数dup、释放函数free、节点值对比函数match;
- 表中节点数据结构:前置节点prev、后置节点next、节点值value;
- 链表特点:双端、无环、表头表尾指针、长度计数器、多态(使用void *指针来保存节点值,可以用于保存各种不同类型的值)
- 字典是redis数据库的底层实现,对数据的增删查改操作都是构建在字典操作上的;
- 字典dict数据结构:类型特定函数dictType(多态字典)、私有函数void *privdata(类型特定的参数)、哈希表数据dictht ht[2](两个哈希表用于做rehash和渐进式hast);
- 哈希表是字典的底层实现,其结构为:dictEntry **table哈希表数组、long size哈希表大小、long sizemask哈希表掩码,用于计算索引值、long used哈希表已有节点数量、int trehashidx rehash是否在进行的标识;
- 哈希表数组的元素是哈希表节点,是保存字典中键值对的地方,即真正保存数据的地方,其结构为:*key键指针、v值、dictEntry *next下个哈希表节点,用于哈希值相同时,将当期值插入到表头,形成列表,解决键冲突问题;
- 哈希过程:根据键值使用MurmurHash2算法计算哈希值,然后与表掩码取模,得到index作为存放哈希表数组的位置,如果当前index已经有节点了,则在此节点头插入当前节点,形成链表。类似java中map结构put值的过程;
- rehash的过程:当字典中的哈希表[0]变化的时候,为了让负载因子维持在合理范围,会做rehash操作,其步骤如下:
- 为哈希表[1]分配空间,并根据扩展还是压缩操作设置其大小,值为2的N次方,扩展值为第一个大于等于ht[0]*used*2的2的n次幂,收缩操作为第一个大于等于ht[0]*used的2的N次幂;
- 将ht[0]中的所有键值rehash到ht[1]上,完成后释放ht[0],并间ht[1]设为ht[0],并重新创建一个空白的ht[1哈希表为下一次rehash做准备;(如果键值量大,会采用渐进式rehash的方式,在此期间会同时使用ht[0]和ht[1])。
- 跳跃表是一种有序数据结构,通过在每个节点中维持多个指向其他及节点的指针达到快速访问节点的目的;
- redis使用跳跃表用作实现有序集合键以及在集群节点中用作内部数据结构
- 用于少量整数的集合,是集合键的底层实现之一;
- 整数集合intset由encoding编码方式、length包含元素数量、contents元素数组三部分组成,各项在数组contents中按值的大小从小到大有序排列,不包含重复项;
- 当新添加的元素值大于现有集合encoding制定的范围时引发升级,现有元素所在位数增加;升级操作可以提升存储数据的灵活性,并节约内存;
- 不支持降级操作
- 压缩列表是一系列特殊编码的连续内存块组成的顺序型数据结构,为节约内存而开发,是列表键和哈希键的底层实现之一;
- 组成部分:zlbytes:4个字节,记录整个压缩列表占用的内存字节数;zltail4个字节,记录表尾节点距离压缩列表起始地址有多少字节;zllen,2个字节,记录压缩列表包含的节点数量;entryX列表节点;zlend:1个字节,特殊值0xFF用于标记压缩列表的末端;
- 列表节点由三部分构成:previous_entry_length记录压缩列表中前一个节点的长度,可用于从表尾向表头遍历;encoding记录本节点所保存的数据类型及长度;content保存节点值,可以是字节数组或整数;
- 当前一节点长度小于254字节,previous_entry_length占1字节,否则占5字节,因此有可能插入一个长度大于254字节的节点到表头是,如果后续节点都介于250到253之间,则可能发生连锁更新,影响性能。不过概率很小。
######以上文字来自Dimmacro,转载请说明来源:http://www.cnblogs.com/dimmacro/ #######
Redis设计与实现-内部数据结构篇的更多相关文章
- 共读《redis设计与实现》-数据结构篇
准备将之前攒下的书先看一遍,主要是有个大概的了解,以后用的时候也知道在哪里找.所以准备开几篇共读的帖子,激励自己多看一些书. Redis 基于 简单动态字符串(SDS).双端链表.字典.压缩列表.整数 ...
- 图解Redis之数据结构篇——链表
前言 Redis链表为双向无环链表! 图解Redis之数据结构篇--简单动态字符串SDS提到Redis使用了简单动态字符串,链表,字典(散列表),跳跃表,整数集合,压缩列表这些数据结构 ...
- 图解Redis之数据结构篇——简单动态字符串SDS
图解Redis之数据结构篇--简单动态字符串SDS 前言 相信用过Redis的人都知道,Redis提供了一个逻辑上的对象系统构建了一个键值对数据库以供客户端用户使用.这个对象系统包括字符串对象 ...
- 探索Redis设计与实现6:Redis内部数据结构详解——skiplist
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 探索Redis设计与实现7:Redis内部数据结构详解——intset
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 探索Redis设计与实现5:Redis内部数据结构详解——quicklist
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 探索Redis设计与实现4:Redis内部数据结构详解——ziplist
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 探索Redis设计与实现3:Redis内部数据结构详解——sds
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
- 探索Redis设计与实现2:Redis内部数据结构详解——dict
本文转自互联网 本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial ...
随机推荐
- 利用EEPROM实现arduino的断电存储
转载请注明:@小五义http://www.cnblogs.com/xiaowuyiQQ群:64770604 一.EEPROM简介 EEPROM (Electrically Erasable Progr ...
- 机器学习编程语言之争,Python 夺魁【转载+整理】
原文地址 en cn 本文内容 表现平平的 MATLAB 貌似强大的 Julia 本身无错的 R 语言 逐渐没落的 Perl 老而弥坚的 Python 我个人很喜欢 Python~ 随着科技的发展,拥 ...
- Ubuntu上安装和使用SSH,Xming+PuTTY在Windows下远程Linux主机使用图形界面的程序
自:http://blog.csdn.net/neofung/article/details/6574002 Ubuntu上安装和使用SSH 网上有很多介绍在Ubuntu下开启SSH服务的文章,但大 ...
- C# inline-asm / 嵌入x86汇编
C#可不可以嵌入汇编 可以 在我眼中C#作为一个介于中上层语言是不可能不可以 置入汇编代码的 为什么会被我认为中上层语言呢 从C#保留指针就可以看出 我知 道有很多人一定不会相信C#可以使用汇编代码 ...
- 完全图解scrollLeft,scrollWidth,clientWidth,offsetWidth 获取相对途径,滚动图片(网上找的,未经试验,但觉得比较好)
获取元素的位置属性可以通过 HTMLElement.offsetLeft HTMLElement.offsetTop 但是,这两个属性所储存的数值并不是该元素相对整个浏览器画布的绝对位置,而是相对于其 ...
- linux red hat 安装svn
安装步骤如下: 1.yum install subversion 2.输入rpm -ql subversion查看安装位置,如下图: 我们知道svn在bin目录下生成了几个二进制文件. 输入 ...
- ECshop鼠标划过弹出 微信扫一扫代码
效果如上图 安装步骤:1,将以下代码放到page_header.lbi里 <div class="f_l"><a href="../index.p ...
- Java程序员转Android开发必读经验分享
小编最近几日偷偷的发现部分Java程序员想转安卓开发,故此加紧补充知识,为大家搜集资料,积极整理前人的经验,希望可以给正处于困惑中的你,带来些许的帮助. 啰哩啰嗦的说说Java和Android程序的区 ...
- 在 远程桌面 权限不足无法控制 UAC 提示时,可使用 计划任务 绕开系统的 UAC 提示
就是记录一下,在远程的时候,很可能远程软件没有以管理员身份运行,或者其它原因,操作会被系统阻止,UAC 会进行提示,但是远程软件目前是无法操作的.(以下方法在 Windows 7 中测试通过) 可以通 ...
- Java WebService 简单实例[转]
http://www.cnblogs.com/yisheng163/p/4524808.html?utm_source=tuicool 前言:朋友们开始以下教程前,请先看第五大点的注意事项,以避免不必 ...