Redis数据的底层存储原理

redis底层是用什么结构来存储数据的呢？

我们从源码上去理解就会容易的多：

redis底层是使用C语言来编写的，我们可以看到它的数据结构声明。一个 dict 有两个dictht，一个dictht有一个dictEntry数组，每个dictEntry有next指针，redisObject是真正存储redis各种类型的结构。因此是一个链表结构。从上面的分析可以看出Redis用拉链法解决冲突的哈希表结构。

“链地址法”的问题在于当碰撞剧烈时，性能退化严重，例如：当有n个数据，m个槽位，如果m=1，则整个Hash表退化为链表，查询复杂度O(n)

为了避免Hash碰撞，Redis的方案是“双dictht”，正常流程使用一个dictht，当发现碰撞剧烈（判断依据为当前槽位数和Key数的对比），分配一个更大的dictht，然后逐步将数据从老的dictht迁移到新的dictht上去。这就需要进行rehash。

typedef struct dict {

   dictType *type;

   void *privdata;

   dictht ht[2];

   long rehashidx; /* rehashing not in progress if rehashidx == -1 */

   unsigned long iterators; /* number of iterators currently running */

} dict;

/* This is our hash table structure. Every dictionary has two of this as we

* implement incremental rehashing, for the old to the new table. */

typedef struct dictht {

   dictEntry **table;

   unsigned long size;

   unsigned long sizemask;

   unsigned long used;

} dictht;

typedef struct dictEntry {

   void *key;

   union {

       void *val;

       uint64_t u64;

       int64_t s64;

       double d;

   } v;

   struct dictEntry *next;

} dictEntry;

//redisObject是真正存储redis各种类型的结构，定义如下：

#define REDIS_STRING 0

#define REDIS_LIST 1

#define REDIS_SET 2

#define REDIS_ZSET 3

#define REDIS_HASH 4

typedef struct redisObject {

  unsigned type:1; //逻辑类型

  unsigned notused:2;     /* Not used */

  unsigned encoding:4; //物理存储类型

  unsigned lru:22;        /* lru time (relative to server.lruclock) */

  int refcount;

  void *ptr;  //具体数据

} robj;

如下是rehash方法的源码：

rehash 操作不是一次性完成，而是采用渐进方式，这是为了避免一次性执行过多的 rehash 操作给服务器带来过大的负担。

渐进式 rehash 通过记录 dict 的 rehashidx 完成，它从0开始然后每执行一次rehash都会递增。例如在一次 rehash 中，要把 dict[0] rehash到dict[1]，这一次会把 dict[0] 上 table[rehashidx] 的键值对 rehash 到 dict[1] 上，dict[0] 的 table[rehashidx] 指向 null，并令 rehashidx++。
在 rehash 期间，每次对字典执行添加、删除、查找或者更新操作时，都会执行一次渐进式 rehash。
采用渐进式 rehash 会导致字典中的数据分散在两个 dictht 上，因此对字典的操作也需要到对应的 dictht 去执行。

int dictRehash(dict *d, int n) {

   int empty_visits = n * 10; /* Max number of empty buckets to visit. */

   if (!dictIsRehashing(d)) return 0;

   while (n-- && d->ht[0].used != 0) {

       dictEntry *de, *nextde;

       /* Note that rehashidx can't overflow as we are sure there are more

        * elements because ht[0].used != 0 */

       assert(d->ht[0].size > (unsigned long) d->rehashidx);

       while (d->ht[0].table[d->rehashidx] == NULL) {

           d->rehashidx++;

           if (--empty_visits == 0) return 1;

       }

       de = d->ht[0].table[d->rehashidx];

       /* Move all the keys in this bucket from the old to the new hash HT */

       while (de) {

           uint64_t h;

           nextde = de->next;

           /* Get the index in the new hash table */

           h = dictHashKey(d, de->key) & d->ht[1].sizemask;

           de->next = d->ht[1].table[h];

           d->ht[1].table[h] = de;

           d->ht[0].used--;

           d->ht[1].used++;

           de = nextde;

       }

       d->ht[0].table[d->rehashidx] = NULL;

       d->rehashidx++;

   }

   /* Check if we already rehashed the whole table... */

   if (d->ht[0].used == 0) {

       zfree(d->ht[0].table);

       d->ht[0] = d->ht[1];

       _dictReset(&d->ht[1]);

       d->rehashidx = -1;

       return 0;

   }

   /* More to rehash... */

   return 1;

}

那底层数据的有序性是如何实现的呢？

跳跃表是有序集合的底层实现之一。

跳跃表是基于多指针有序链表实现的，可以看成多个有序链表。
跳跃表是一种随机化数据结构，查找、添加、删除操作都可以在对数期望时间下完成。
跳跃表目前在 Redis 的唯一作用，就是作为有序集类型的底层数据结构（之一，另一个构成有序集的结构是字典）。
与红黑树等平衡树相比，跳跃表具有以下优点：
- 插入速度非常快速，因为不需要平衡树的旋转操作；
- 更容易实现；
- 支持无锁操作。

跳跃表的定义可以在任何一本算法或数据结构的书中找到，在这不介绍跳跃表的具体实现方式或者具体的算法。推荐一篇漫画，可以快速理解跳跃表，想要深入理解跳跃表，推荐一篇博客。

Redis数据的底层存储原理的更多相关文章

HBase底层存储原理
HBase底层存储原理——我靠,和cassandra本质上没有区别啊!都是kv 列存储,只是一个是p2p另一个是集中式而已! 首先HBase不同于一般的关系数据库, 它是一个适合于非结构化数据存储的数 ...
Redis数据持久化机制AOF原理分析一---转
http://blog.csdn.net/acceptedxukai/article/details/18136903 http://blog.csdn.net/acceptedxukai/artic ...
Protobuf底层存储原理
参考官网, 序列化原理底层二进制存储 message Test1 { optional int32 a = 1; } 并设置为a=150,序列化到一个文件中,查看文件,得到下面的二进制: 08 96 ...
HBase底层存储原理——我靠，和cassandra本质上没有区别啊！都是kv 列存储，只是一个是p2p另一个是集中式而已！
理解HBase(一个开源的Google的BigTable实际应用)最大的困难是HBase的数据结构概念究竟是什么?首先HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库.另一个不 ...
python-变量&底层存储原理
目录 1.变量 1.变量如何使用 2.变量存储的原理 --[ 重点 ] 3.变量存储要遵循印射关系 4.变量三要素 2.常量 3.底层优化 4.垃圾回收机制 1.变量 1.变量如何使用 1.什么是变量 ...
高性能的Redis之对象底层实现原理详解
对象在前面的数个章节里, 我们陆续介绍了 Redis 用到的所有主要数据结构, 比如简单动态字符串(SDS).双端链表.字典.压缩列表.整数集合, 等等. Redis 并没有直接使用这些数据结构来实 ...
列式数据库~clickhouse 底层存储原理
简介:今天介绍列式数据库的一些基本原理一数据目录 Data目录数据存储目录,数据按照part分成多个文件夹,每个文件夹下存储相应数据和对应的元信息文件 Metadata 表定义语句,存储所有表 ...
Redis(一)：基本数据类型与底层存储结构
最近在整理有关redis的相关知识,对于redis的基本数据类型以及其底层的存储结构简要的进行汇总和备注(主要为面试用) Redis对外提供的基本数据类型主要为五类,分别是 STRING:可以存储字符 ...
V7000存储数据恢复_底层结构原理拆解及Mdisk磁盘掉线数据恢复方法
Storwize V7000(也就是我们常说的V7000)是新推出的一款中端存储系统,这款系统的定位虽然在中端,但是Storwize V7000提供有存储管理功能,这一功能以前只有高端存储才拥有(例如 ...

随机推荐

C# 核心语法-反射（反射类型、方法、构造函数、属性，实现可配置可扩展，完成数据库访问类反射封装）
反射是.NET中的重要机制,通过反射,可以在运行时获得程序或程序集中每一个类型(包括类.结构.委托.接口和枚举等)的成员和成员的信息.有了反射,即可对每一个类型了如指掌.另外我还可以直接创建对象,即使 ...
Python——爬虫学习1
爬虫了解一下网络爬虫(Web crawler),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本. Python的安装本篇教程采用Python3 来写,所以你需要给你的电脑装上Python ...
Spring定时(任务)刷新-quartz
Quartz是一个完全由java编写的开源作业调度框架.他可以与J2EE.J2SE集成,用与处理定时任务.定时刷新的需求.此处使用为与Spring项目集成. 在SpringMVC项目中使用quartz ...
vscode 安装插件，和相关配置
安装插件,配置对应的用户设置,进行替换,实现插件功能的生效 { // 控制是否在搜索中跟踪符号链接. "search.followSymlinks": false, "e ...
IO流实现模拟软件试用的功能
import java.io.*; public class TryOut { /** * IO流模拟软件试用次数的功能 * 这里注意try里BufferedOutputStream不要和InputS ...
阿里巴巴的数据池DRUID
使用了阿里巴巴的数据池管理: 监控DB池连接和SQL的执行情况 https://github.com/alibaba/druid/wiki/常见问题 https://www.cnblogs.com ...
grpc的数据包监控
CommView是一个专门为网络管理员,安全专家,网络程序员,以及任何想要全面了解一台个人电脑或一个网段中的网络通信量的用户设计的强大的网络监控器和分析器,不过它支持Win系统. 我这里用的 Comm ...
JSON 解析的可抛弃
先看例子, json文件中有些元素不是我们想要的,在反序列化时可以当它们不存在,下面例子抛弃了 aaa.ccc这两节. package main import ( "encoding ...
Redis-Map
Redis Map 存储K-V键值对.(跟Java的Map类比) 哈希表结构: typedef struct dictht { dictEntry **table; //哈希表数组 unsigned ...
jquery 提示语淡入效果
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...

Redis数据的底层存储原理

Redis数据的底层存储原理的更多相关文章

随机推荐

热门专题