对于上一篇文章,我又自己总结归纳并补充了一下,有了第二篇。

概览

<<左移

开始之前,我们先准备点东西:位运算

  1. i<<n 总结为 i*2^n

所以

1<<5 = 2^5

1<<8 = 2^8

1<<16 = 2^16

1<<32 = 2^32

1<<64 = 2^64

SDS 5种数据类型

Redis 3.2 以后SDS数据类型有5个

  1. #define SDS_TYPE_5 0
  2. #define SDS_TYPE_8 1
  3. #define SDS_TYPE_16 2
  4. #define SDS_TYPE_32 3
  5. #define SDS_TYPE_64 4

结合上面的位运算,我们也能理解这5个数据类型的命名规则。

外部类型String 找 SDS结构

我们现在有定义了5种SDS数据类型,那么如何根据字符串长度找这些类型呢?

或者说输入的字符串长度和类型有什么关系?下面我们来看一看他们之间的关系。

再来看看源码:

  1. static inline char sdsReqType(size_t string_size) {
  2. if (string_size < 1<<5)
  3. return SDS_TYPE_5;
  4. if (string_size < 1<<8)
  5. return SDS_TYPE_8;
  6. if (string_size < 1<<16)
  7. return SDS_TYPE_16;
  8. #if (LONG_MAX == LLONG_MAX)
  9. if (string_size < 1ll<<32)
  10. return SDS_TYPE_32;
  11. return SDS_TYPE_64;
  12. #else
  13. return SDS_TYPE_32;
  14. #endif
  15. }

根据位运算左移公式,我可以得知 1<<8 = 2^8 = 256

那么这里的 256是指什么?这里的256就是字节

也就是说:

SDS_TYPE_5 -- 32 Byte

SDS_TYPE_8 -- 256 Byte

SDS_TYPE_16 -- 64KB

SDS_TYPE_32 -- ...

SDS_TYPE_64 -- ...

现在数据类型找到了,我们再来看看比较典型的几种操作。

追加字符串

从使用角度讲,追加一般用的频率很少。所以有多大分配多大。

所以这里追加的话,有两种大情况:还有剩余 或 不够用

主要讲一下不够用就要重新申请内存,那么我们如何去申请内存呢?

这里提供了两种分配策略:

  1. <1M ,新空间 = 2倍扩容;
  2. >1M , 新空间 = 累加1M

空间有了,那么我们需要根据最新的空间长度占用,再找到对应的新的SDS数据类型。

看一下源码,增加一下印象:

  1. /* 追加字符串*/
  2. sds sdscatlen(sds s, const void *t, size_t len) {
  3. // 当前字符串长度
  4. size_t curlen = sdslen(s);
  5. // 按需调整空间(原来字符串,要追加的长度)
  6. s = sdsMakeRoomFor(s,len);
  7. // 内存不足
  8. if (s == NULL) return NULL;
  9. // 追加目标字符串到字节数组中
  10. memcpy(s+curlen, t, len);
  11. // 设置追加后的长度
  12. sdssetlen(s, curlen+len);
  13. // 追加结束符
  14. s[curlen+len] = '\0';
  15. return s;
  16. }
  1. /*空间调整,注意只是调整空间,后续自己组装字符串*/
  2. sds sdsMakeRoomFor(sds s, size_t addlen) {
  3. void *sh, *newsh;
  4. // 当前剩下的空间
  5. size_t avail = sdsavail(s);
  6. size_t len, newlen;
  7. char type, oldtype = s[-1] & SDS_TYPE_MASK;
  8. int hdrlen;
  9. /* 空间足够 */
  10. if (avail >= addlen) return s;
  11. // 长度
  12. len = sdslen(s);
  13. // 真正的数据体
  14. sh = (char*)s-sdsHdrSize(oldtype);
  15. // 新长度
  16. newlen = (len+addlen);
  17. // < 1M 2倍扩容
  18. if (newlen < SDS_MAX_PREALLOC)
  19. newlen *= 2;
  20. // > 1M 扩容1M
  21. else
  22. newlen += SDS_MAX_PREALLOC;
  23. // 获取sds 结构类型
  24. type = sdsReqType(newlen);
  25. // type5 默认转成 type8
  26. if (type == SDS_TYPE_5) type = SDS_TYPE_8;
  27. // 头长度
  28. hdrlen = sdsHdrSize(type);
  29. if (oldtype==type) { // 长度够用 并且 数据结构不变
  30. newsh = s_realloc(sh, hdrlen+newlen+1);
  31. if (newsh == NULL) return NULL;
  32. s = (char*)newsh+hdrlen;
  33. } else {
  34. // 重新申请内存
  35. newsh = s_malloc(hdrlen+newlen+1);
  36. if (newsh == NULL) return NULL;
  37. memcpy((char*)newsh+hdrlen, s, len+1);
  38. s_free(sh);
  39. s = (char*)newsh+hdrlen;
  40. s[-1] = type;
  41. sdssetlen(s, len);
  42. }
  43. sdssetalloc(s, newlen);
  44. return s;
  45. }

SDS 和 内部类型

外部字符串类型,找到了SDS结构,现在到了SDS转内部结构

对于字符串类型为什么会分 embstr 和 raw呢?

我们先说一下内存分配器:jemalloc、tcmalloc

这来能为仁兄呢分配内存的大小都是 2/4/8/16/32/64 字节

对于redis 来讲如何利用并适配好内存分配器依然需要好好计算一下。

Redis 给我们实现了很多内部数据结构,这些内部数据结构得有自己的字描述文件-内部结构头对象

不同对象有不同的type,同一个对象有不同的存储形式,还有lru缓存淘汰机制信息,引用计数器,指向数据体的指针。

  1. typedef struct redisObject {
  2. unsigned type:4;
  3. unsigned encoding:4;
  4. unsigned lru:LRU_BITS;
  5. int refcount;      
  6. void *ptr;
  7. } robj;

所以SDS和 内部类型的关系类似于这样的:

连续内存,和非连续内存

44 字节

SDS为什么会是这样的两种内部结构呢?

  1. 回忆一下上面提到的:SDS结构,最小的应该是 SDS_TYPE_8SDS_TYPE_5默认转成8)
  1. struc SDS{
  2. int8 capacity; // 1字节
  3. int8 len; // 1字节
  4. int8 flags; // 1字节
  5. byte[] content; // 内容
  6. }

所以从上代码看出,一个最小的SDS,至少占用3字节.

  1. 还有内部结构头:RedisObject
  1. typedef struct redisObject {
  2. unsigned type:4; // 4bit
  3. unsigned encoding:4; // 4bit
  4. unsigned lru:LRU_BITS; // 24bit
  5. int refcount;       // 4字节
  6. void *ptr; // 8字节
  7. } robj;

16字节 = 32bit(4字节) + 4字节 + 8字节

所以一个内部类型头指针大小为:16字节

再加上最小SDS的3字节,一共 19字节。也就是说一个最小的字符串所占用的内存空间是19字节

还记得上面我们提到过的内存分配器么?(2/4/8/16/32/64 字节)

对,如果要给这个最小19字节分配内存,至少要分配一个32字节的内存。当然如果字符串长一点,再往下就可以分配到64字节的内存。

以上这种形式被叫做:embstr,这种形式使得 RedisObject和SDS 内存地址是连续的。

那么一旦大于64字节,形式就变成了raw,这种形式使得内存不连续,因为SDS已经变大,取得大的连续内存得不偿失。

再回来讨论一下 embstr, 最大64字节内存分配下来,我们实际可以真正存储字符串的长度是多少呢?--44字节

64字节,减去RedisObject头信息19字节,再减去3字节SDS头信息,剩下45字节,再去除\0结尾。这样最后可以存储44字节。

所以 embstr 形式,可以存储最大字符串长度是44字节。

关于字符串最大是512M

  1. Strings
  2. Strings are the most basic kind of Redis value. Redis Strings are binary safe,
  3. this means that a Redis string can contain any kind of data,
  4. for instance a JPEG image or a serialized Ruby object.
  5. A String value can be at max 512 Megabytes in length.

出个题(redis 5.0.5版本)

SET q sc

encoding:embstr,长度为3

现在做追加操作,APPEND q scadd ,encoding:raw,长度8

  1. 为什么从 sc ----> scscadd 简单的追加操作内部类型会从 embstr -----> raw ,如何解释?

喜欢的欢迎加公众号或者留言评论探讨

Redis开发与运维:SDS与embstr、raw 深入理解的更多相关文章

  1. Redis开发与运维:SDS

    STRING 我们会经常打交道的string类型,在redis中拥有广泛的使用.也是开启redis数据类型的基础. 在我最最开始接触的redis的时候,总是以为字符串类型就是值的类型是字符串. 比如: ...

  2. Redis开发与运维学习笔记

    <Redis开发与运维>读书笔记   一.初始Redis 1.Redis特性与优点 速度快.redis所有数据都存放于内存:是用C语言实现,更加贴近硬件:使用了单线程架构,避免了多线程竞争 ...

  3. Redis 开发与运维

    Getting Start 高性能 性能优势的体现 C语言实现的内存管理 epoll的I/O多路复用技术+IO连接/关闭/读写通过事件实现异步的非阻塞IO TCP协议 单线程架构,不会因为高并发对服务 ...

  4. Redis实战(七)Redis开发与运维

    Redis用途 1.缓存 Redis提供了键值过期时间设置, 并且也提供了灵活控制最大内存和内存溢出后的淘汰策略. 可以这么说, 一个合理的缓存设计能够为一个网站的稳定保驾护航. 2.排行榜系统 Re ...

  5. 《Redis开发与运维》

    第1章 初识Redis 1. Redis介绍: Redis是一种基于键值对(key-value)的NoSQL数据库. 与很多键值对数据库不同的是,Redis中的值可以是由string(字符串).has ...

  6. 《Redis开发与运维》快速笔记(一)

    1.前言&基本介绍 在原始的系统架构中,我们都由程序直接连接DB,随着业务的进一步开展,DB的压力越来越大,为了缓解DB的这一压力,我们引入了缓存,在程序连接DB中加入缓存层, 从而减轻数据库 ...

  7. 《Redis开发与运维》读书笔记

    一.初始Redis 1.Redis特性与优点 速度快.redis所有数据都存放于内存:是用C语言实现,更加贴近硬件:使用了单线程架构,避免了多线程竞争问题 基于键值对的数据结构,支持的数据结构丰富.它 ...

  8. redis 开发与运维 学习心得1

    主要是命令相关 第一章 初识Redis 1.redis是基于键值对的NoSQL. 2.redis的值可以是 string, hash, list, set, zset, bitmaps, hyperl ...

  9. Redis开发与运维

    常用命令 redis-server启动redis redis-server /opt/redis/redis.conf    配置启动 redis-server --port 6379 --dir / ...

随机推荐

  1. Hadoop 在 windows 7 64位的配置(一)|非cygwin

    参照原文   http://blog.csdn.net/supperman_009/article/details/39991809 环境: Hadoop-2.4.1 Windows 7 64位 jd ...

  2. python的多线程和多进程(一)

    在进入主题之前,我们先学习一下并发和并行的概念: --并发:在操作系统中,并发是指一个时间段中有几个程序都处于启动到运行完毕之间,且这几个程序都是在同一个处理机上运行.但任一时刻点上只有一个程序在处理 ...

  3. 神舟+win10+ubuntu16.04+256GSSD+1THHD双系统安装加openssl踩坑之旅

    上海最近搞活动调休,要搞深度学习,win上还是不方便,准备弄个ubuntu.于是有以下回忆文字. 在机器上装了个双系统.花了两天.再也不想玩了. 准备用ubuntu来做深度学习的. 本文写于2019年 ...

  4. 列表[‘hello’ , ‘python’ ,’!’ ] 用多种方法拼接,并输出’hello python !’ 以及join()在python中的用法简介

    列表[‘hello’ , ‘python’ ,’!’ ] 用多种方法拼接,并输出’hello python !’ 使用字符串链接的四种方法都可以创建 字符串拼接一共有四种方法,也可以应用到列表的拼接中 ...

  5. vue之页面缓存问题(基于2.0)

    为什么会有这篇文章 在vue2.0中出现了列表页面是每次都重新加载数据,但是详情页面却只在第一次加载的时候调用数据,如果返回到列表再进入详情那么页面是不会重新渲染页面. 1 用vue-router 重 ...

  6. 给自己网站配置 https,http2 ,gzip压缩

    https 需要购买域名ssl证书 注意事项: 1.要开启HTTP/2协议支持,需要在nginx 1.10以上版本并且需要openssl库的版本在1.0.2及以上编译. 2.http2.0只支持开启了 ...

  7. EXCEL批量导入到Sqlserver数据库并进行两表间数据的批量修改

    Excel 大量数据导入到sqlserver生成临时表并将临时表某字段的数据批量更新的原表中的某个字段 1:首先要对EXCEL进行处理 列名改成英文,不要有多余的列和行(通过ctrl+shift 左或 ...

  8. Luogu P1098 字符串的展开

    这几天划了划水看了看初赛的试题,没写什么随笔. 今天刷刷洛谷试炼场.(不要问为什么我还在普及区) 题目描述 在初赛普及组的“阅读程序写结果”的问题中,我们曾给出一个字符串展开的例子:如果在输入的字符串 ...

  9. [2018-07-19] 安装python

    1.Python官网 https://www.python.org/downloads/ 2.应该使用Python2.x还是Python3.x? Python有2.x和3.x两个版本,这两个版本是不兼 ...

  10. 网络安全-主动信息收集篇第二章-二层网络扫描之arping

    arping二层网络发现 介绍工具:arping arping主要查看IP的MAC地址 缺点:工具本身只能ping一个IP地址,不能ping一个IP段.但是可以通过脚本将整个网络中的IP进行扫描. 脚 ...