本文及后续文章,Redis版本均是v3.2.8

我们会经常选择使用sorted set数据结构,是由于其提供的操作非常丰富,可以满足非常多的应用场景。sorted set数据结构是由skiplist(跳跃列表)、ziplist和dict实现的。

skiplist本质上是一种查找数据据结构,即根据给定的key,快速查到它所对应的value。

  • skiplist是一种链式数据结构,在外观表现上其具有两个属性:分值和保存的对象。

  • skiplist通过对每个节点的分值进行排序从而达到排序每个节点的目的。

  • skiplist为了实现跳跃表的快速修改和查询操作,其内部还在每个节点上都保存了一个用于指向其后节点的指针数组,以及一个指向前一个节点的指针;并且为了快速获取跳跃表的节点数目和指针数组的最大长度,其分别创建了一个length和一个level属性用于快速查询。

  • skiplist的平均时间复杂度为O(logN),最坏复杂度为O(N),其性能一般情况下可以与平衡树相媲美。

一、skiplist数据结构定义

我们看下server.h中代码

/* ZSETs use a specialized version of Skiplists */

typedef struct zskiplistNode {

/*成员object对象*/

robj *obj;

/*分数字段依赖此值对skiplist进行排序*/

double score;

/*插入层中指向上一个元素level数组*/

struct zskiplistNode *backward;

struct zskiplistLevel {

/*每层中指向下一个元素指针*/

struct zskiplistNode *forward;

/*距离下一个元素之间元素数量, 即forward指向的元素*/

unsigned int span;

} level[];

} zskiplistNode;

typedef struct zskiplist {

/*跳跃表头节点和尾节点*/

struct zskiplistNode *header, *tail;

/*跳跃表中元素个数*/

unsigned long length;

/*跳跃表当前最大层数*/

int level;

} zskiplist;

1、zskiplistNode定义了skiplist的节点结构

  • obj字段存放的是节点数据,它的类型是一个string robj。本来一个string robj可能存放的不是sds,而是long型,但zadd命令在将数据插入到skiplist里面之前先进行了解码,所以这里的obj字段里存储的一定是一个sds。这样做的目的应该是为了方便在查找的时候对数据进行字典序的比较,而且,skiplist里的数据部分是数字的可能性也比较小。

  • score字段是数据对应的分数。

  • backward字段是指向链表前一个节点的指针(前向指针)。节点只有1个前向指针,所以只有第1层链表是一个双向链表。

  • level[]存放指向各层链表后一个节点的指针(后向指针)。每层对应1个后向指针,用forward字段表示。另外,每个后向指针还对应了一个span值,它表示当前的指针跨越了多少个节点。span用于计算元素排名(rank),这正是前面我们提到的Redis对于skiplist所做的一个扩展。需要注意的是,level[]是一个柔性数组(flexible array member),因此它占用的内存不在zskiplistNode结构里面,而需要插入节点的时候单独为它分配。也正因为如此,skiplist的每个节点所包含的指针数目才是不固定的,我们前面分析过的结论——skiplist每个节点包含的指针数目平均为1/(1-p)——才能有意义。

2、zskiplist定义了真正的skiplist结构,它包含:

  • 头指针header和尾指针tail。

  • 链表长度length,即链表包含的节点总数。注意,新创建的skiplist包含一个空的头指针,这个头指针不包含在length计数中。

  • level表示skiplist的总层数,即所有节点层数的最大值。

总结下跳跃表主要有以下几个部分构成:

1、表头head:负责维护跳跃表的节点指针

2、节点node:实际保存元素值,每个节点有一层或多层

3、层level:保存着指向该层下一个节点的指针

4、表尾tail:全部由null组成

跳跃表的遍历总是从高层开始,然后随着元素值范围的缩小,慢慢降低到低层。

二、skiplist基本操作

我们先来看下使用zskiplist保存数据的示例:

这里需要说明的是,跳跃表的节点数组的长度是随机的,其值为1到32之间的一个整数。

创建的操作

我们看下t_zsset.c的代码

/*创建一个跳跃表节点*/

zskiplistNode *zslCreateNode(int level, double score, robj *obj) {

zskiplistNode *zn = zmalloc(sizeof(*zn)+level*sizeof(struct zskiplistLevel));

zn->score = score;

zn->obj = obj;

return zn;

}

zskiplist *zslCreate(void) {

int j;

zskiplist *zsl;

zsl = zmalloc(sizeof(*zsl));

zsl->level = 1;

zsl->length = 0;

/*初始化创建一个头节点, 初始化节点信息*/

zsl->header = zslCreateNode(ZSKIPLIST_MAXLEVEL,0,NULL);

for (j = 0; j < ZSKIPLIST_MAXLEVEL; j++) {

zsl->header->level[j].forward = NULL;

zsl->header->level[j].span = 0;

}

zsl->header->backward = NULL;

zsl->tail = NULL;

return zsl;

}

从以上代码中看到,创建跳跃表过程比较简单, 初始化zskiplist数据结构, 跳跃表默认最大层数32层, 跳跃表是按score进行升序排列.

插入元素的操作

zskiplistNode *zslInsert(zskiplist *zsl, double score, robj *obj) {

zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;

unsigned int rank[ZSKIPLIST_MAXLEVEL];

int i, level;

redisAssert(!isnan(score));

// 在各个层查找节点的插入位置,从头节点开始搜索, 一层一层向下搜索, 直到直到最后一层, update数组中保存着每层应该插入的位置

// T_wrost = O(N^2), T_avg = O(N log N)

x = zsl->header;

for (i = zsl->level-1; i >= 0; i--) {

/* store rank that is crossed to reach the insert position */

// 如果 i 不是 zsl->level-1 层

// 那么 i 层的起始 rank 值为 i+1 层的 rank 值

// 各个层的 rank 值一层层累积

// 最终 rank[0] 的值加一就是新节点的前置节点的排位

// rank[0] 会在后面成为计算 span 值和 rank 值的基础

rank[i] = i == (zsl->level-1) ? 0 : rank[i+1];

// 沿着前进指针遍历跳跃表

// T_wrost = O(N^2), T_avg = O(N log N)

while (x->level[i].forward &&

(x->level[i].forward->score < score ||

// 比对分值

(x->level[i].forward->score == score &&

// 比对成员

compareStringObjects(x->level[i].forward->obj,obj) < 0))) {

// 记录沿途跨越了多少个节点,即记录每层距离头部位置的距离

rank[i] += x->level[i].span;

// 移动至下一指针

x = x->level[i].forward;

}

// 记录将要和新节点相连接的节点

update[i] = x;

}

/* we assume the key is not already inside, since we allow duplicated

* scores, and the re-insertion of score and redis object should never

* happen since the caller of zslInsert() should test in the hash table

* if the element is already inside or not.

*

* zslInsert() 的调用者会确保同分值且同成员的元素不会出现,

* 所以这里不需要进一步进行检查,可以直接创建新元素。

*/

// 获取一个随机值作为新节点的层数

level = zslRandomLevel();

// 如果新节点的层数比表中其他节点的层数都要大,那么初始化表头节点       中未使用的层,并将它们记录到 update 数组中,将来也指向新节点

if (level > zsl->level) {

// 初始化未使用层

// T = O(1)

for (i = zsl->level; i < level; i++) {

rank[i] = 0;

update[i] = zsl->header;

update[i]->level[i].span = zsl->length; // 这里的span应该是插入的节点的rank值?

}

// 更新表中节点最大层数

zsl->level = level;

}

// 创建新的节点插入到update数组对应的层

x = zslCreateNode(level,score,obj);

// 将前面记录的指针指向新节点,并做相应的设置

for (i = 0; i < level; i++) {

// 设置新节点的 forward 指针

x->level[i].forward = update[i]->level[i].forward;

// 将沿途记录的各个节点的 forward 指针指向新节点

update[i]->level[i].forward = x;

/* update span covered by update[i] as x is inserted here */

// 计算新节点跨越的节点数量,即更新update数组中span值和新插入元素span值, rank[0]存储的是x元素距离头部的距离, rank[i]存储的是update[i]距离头部的距离

x->level[i].span = update[i]->level[i].span - (rank[0] - rank[i]);

// 更新新节点插入之后,沿途节点的 span 值

// 其中的 +1 计算的是新节点

update[i]->level[i].span = (rank[0] - rank[i]) + 1;

}

/* increment span for untouched levels */

// level可能小zsl->level, 无变动的元素span依次增加1

for (i = level; i < zsl->level; i++) {

update[i]->level[i].span++;

}

// 设置新节点的后退指针

x->backward = (update[0] == zsl->header) ? NULL : update[0];

if (x->level[0].forward)

x->level[0].forward->backward = x;

else

zsl->tail = x; //下一个元素为空,则表示x为尾部元素

// 跳跃表的节点计数增一

zsl->length++;

return x;

}

除元素

删除元素需要精确匹配到分数和member

/* Internal function used by zslDelete, zslDeleteByScore and zslDeleteByRank */

// 具体进行删除元素所在节点

void zslDeleteNode(zskiplist *zsl, zskiplistNode *x, zskiplistNode **update) {

int i;

// 删除元素需要更新update元素的span值

for (i = 0; i < zsl->level; i++) {

if (update[i]->level[i].forward == x) {

update[i]->level[i].span += x->level[i].span - 1;

update[i]->level[i].forward = x->level[i].forward;

} else {

update[i]->level[i].span -= 1;

}

}

if (x->level[0].forward) {

// 非尾部元素则需要重置backforward指针

x->level[0].forward->backward = x->backward;

} else {

// 删除x可能是最后一个元素, 需要重置尾部指针

zsl->tail = x->backward;

}

// 删除元素位于最上层, 并且仅有此一个元素, 删除之后,需要降低跳跃表层数

while(zsl->level > 1 && zsl->header->level[zsl->level-1].forward == NULL)

zsl->level--;

zsl->length--;

}

/* Delete an element with matching score/object from the skiplist. */

int zslDelete(zskiplist *zsl, double score, robj *obj) {

zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;

int i;

x = zsl->header;

for (i = zsl->level-1; i >= 0; i--) {

while (x->level[i].forward &&

(x->level[i].forward->score < score ||

(x->level[i].forward->score == score &&

compareStringObjects(x->level[i].forward->obj,obj) < 0)))

x = x->level[i].forward;

update[i] = x;

}

/* We may have multiple elements with the same score, what we need

* is to find the element with both the right score and object. */

// 由于score值可能相等, 因此需要精确匹配score和obj值

x = x->level[0].forward;

if (x && score == x->score && equalStringObjects(x->obj,obj)) {

zslDeleteNode(zsl, x, update);

zslFreeNode(x);

return 1;

}

return 0; /* not found */

}

获取排名

排名其实就是元素在skiplist中排列的序号, 获取排名需要给出分数和成员member, 通过score查找, 匹配member成员, 时间复杂度log(N). 由于skiplist是升序排列的,因此函数返回的rank是score按升序排列的rank, 如果想获取降序rank应该是(length-rank).

三、Redis中的sorted set

前面我们提到过,Redis中的sorted set,是在skiplist, dict和ziplist基础上构建起来的:

  • 当数据较少时,sorted set是由一个ziplist来实现的。

  • 当数据多的时候,sorted set是由一个叫zset的数据结构来实现的,这个zset包含一个dict + 一个skiplist。dict用来查询数据到分数(score)的对应关系,而skiplist用来根据分数查询数据(可能是范围查找)。

我们先来讨论下基于ziplist实现的sorted set。在前面讲解ziplist的文章里,我们介绍过,ziplist就是由很多数据项组成的一大块连续内存。由于sorted set的每一项元素都由数据和score组成,因此当使用zadd命令插入一个(数据, score)对的时候,底层在相应的ziplist上就插入两个数据项:数据在前,score在后。

ziplist的主要优点是节省内存,但它上面的查找操作只能按顺序查找(可以正序也可以倒序)。因此,sorted set的各个查询操作,就是在ziplist上从前向后(或从后向前)一步步查找,每一步前进两个数据项,跨域一个(数据, score)对。

随着数据的插入,sorted set底层的这个ziplist就可能会转成zset的实现(转换过程详见t_zset.c的zsetConvert)。那么到底插入多少才会转呢?

还记得Redis中如下的两个配置:

zset-max-ziplist-entries 128
zset-max-ziplist-value 64

这两个配置的意思是说,在如下两个条件之一满足的时候,ziplist会转成zset(具体的触发条件参见t_zset.c中的zaddGenericCommand相关代码):

  • 当sorted set中的元素个数,即(数据, score)对的数目超过128的时候,也就是ziplist数据项超过256的时候。

  • 当sorted set中插入的任意一个数据的长度超过了64的时候。

最后,zset结构的代码定义如下:

typedef struct zset {
   dict *dict;
   zskiplist *zsl;
} zset;

---EOF--

Redis数据结构之skiplist的更多相关文章

  1. Redis数据结构之skiplist(续)

    本文摘抄于<Redis内部数据结构详解-skiplist> 一.skiplist的由来 skiplist,顾名思义,首先它是一个list.实际上,它是在有序链表的基础上发展起来的. 我们先 ...

  2. Redis 数据结构的底层实现 (二) dict skiplist intset

    一.REDIS_INCODING_HT (dict字典,hashtable) dict是一个用于维护key和value映射关系的数据结构.redis的一个database中所有的key到value的映 ...

  3. Redis数据结构之intset

    本文及后续文章,Redis版本均是v3.2.8 上篇文章<Redis数据结构之robj>,我们说到redis object数据结构,其有5中数据类型:OBJ_STRING,OBJ_LIST ...

  4. Redis数据结构之robj

    本文及后续文章,Redis版本均是v3.2.8 我们知道一个database内的这个映射关系是用一个dict来维护的.dict的key固定用一种数据结构来表达,这这数据结构就是动态字符串sds.而va ...

  5. Redis 数据结构之dict

    上篇文章<Redis数据结构概述>中,了解了常用数据结构.我们知道Redis以高效的方式实现了多种数据结构,因此把Redis看做为数据结构服务器也未尝不可.研究Redis的数据结构和正确. ...

  6. Redis 数据结构的实现

    Redis 数据结构的实现 先看个对照关系: Redis数据结构 实现一 实现二 string 整数(如果value能够表示为整数) 字符串 hash 压缩列表(只包含少量键值对, 并且每个键值对的键 ...

  7. redis学习(二) redis数据结构介绍以及常用命令

    redis数据结构介绍 我们已经知道redis是一个基于key-value数据存储的数据结构数据库,这里的key指的是string类型,而对应的value则可以是多样的数据结构.其中包括下面五种类型: ...

  8. 【Redis】270- 你需要知道的那些 redis 数据结构

    本文出自「掘金社区」,欢迎戳「阅读原文」链接和作者进行技术交流 ?? 作者简介 世宇,一个喜欢吉他.MDD 摄影.自走棋的工程师,属于饿了么上海物流研发部.目前负责的是网格商圈.代理商基础产线,平时喜 ...

  9. 5种Redis数据结构详解

    本文主要和大家分享 5种Redis数据结构详解,希望文中的案例和代码,能帮助到大家. 转载链接:https://www.php.cn/php-weizijiaocheng-388126.html 2. ...

随机推荐

  1. neutron-删除负载均衡器

    neutron-删除负载均衡器 在清除垃圾数据的时候,删除负载均衡器,总是有很多依赖.写了一个脚本,连同依赖资源一起删除 #!/bin/bash delete(){ local id id=$1 lo ...

  2. python xpath学习

    一.选取节点: 二.谓词: 注意:在scrapy中用xpath进行搜索时,如果使用相对路径,要加上.,如,不然搜索的是整个文档.

  3. [FJOI2018]领导集团问题

    [FJOI2018]领导集团问题 dp[i][j],i为根子树,最上面的值是j,选择的最大值 观察dp方程 1.整体Dp已经可以做了. 2.考虑优美一些的做法: dp[i]如果对j取后缀最大值,显然是 ...

  4. golang的socket服务端与客户端

    服务端 服务端的处理流程 监听端口 接收客户端的链接 创建goroutine,处理该链接 package main import ( "fmt" "net" ) ...

  5. linux串口编程设置(转载)

    (转载)在嵌入式Linux中,串口是一个字设备,访问具体的串行端口的编程与读/写文件 的操作类似,只需打开相应的设备文件即可操作.串口编程特殊在于串 口通信时相关参数与属性的设置.嵌入式Linux的串 ...

  6. rsync实时同步服务部署

    部署rsync服务 一.需求:把客户端文件同步到服务端指定位置服务端:备份服务器为 172.16.3.164客户端:推送服务器为 172.16.3.94 二.基础知识: rsync 分为服务器端.客户 ...

  7. Unity 动画系统

    Legacy动画系统:Animation组件(旧) Mecanim动画系统:Animator组件(新) 动画播放过程: //动画片段 [System.Serializable] public clas ...

  8. vbox安装增强功能,实现宿主机文件夹共享并浏览器访问

    虚拟机版本:6.0.4 r128413 (Qt5.6.2) linux:centos7/6 点击菜单栏中的设备->安装增强功能,再reboot 获取内核版本号 uname -r 查看yum的内核 ...

  9. Python的设计模式

    设计模式是什么? 设计模式是经过总结.优化的,对我们经常会碰到的一些编程问题的可重用解决方案.一个设计模式并不像一个类或一个库那样能够直接作用于我们的代码.反之,设计模式更为高级,它是一种必须在特定情 ...

  10. JProfiler性能分析工具

    1.简介 JProfiler是一个商业授权的Java剖析工具,用于分析Java EE和Java SE应用程序. 2.JVMTI JDK本身定义了目标明确并功能完善的JNI(Java Native In ...