面试官:Redis中的缓冲区了解吗
hello 大家好,我是七淅(xī)。
Redis 大家肯定不陌生,但在使用层面看不到的地方,就容易被忽略。今天想和大家分享的内容是 Redis 各个缓冲区的作用、溢出的后果及优化方向。
在开始正文前,想多叨叨几句。不管是 Redis 还是其他中间件,底层很多原理都是相似的,设计思想都是通用的。
大家以后如果在学什么新框架/组件,可以尽量和已经学过的知识点进行联想,这样会更容易理解点的,不至于说死记硬背。
比如现在说到的缓冲区,它的目的是什么呢?
无它,为了性能。
要么缓存数据,提高响应速度。比如 MySQL 中有个 change buffer
要么担心消费者速度跟不上生产,怕数据丢失。所以需要把生产数据先暂存起来。Redis 的缓冲区就是这个作用。
另外,消费者速度跟不上,如果是同步处理的话,那是不是也会拖慢生产者,所以这里其实也是在保证生产者的速度。
可能有的读者会说:扯淡,消费者都跟不上了,生产者再快有什么用?
其实有没有一种可能,生产者根本不关心消费者什么时候用呢?前者是负责把后者需要的东西处理好给它就完事了。生产者很忙,还有其他一大堆数据要处理,不能慢慢等消费者同步消费完才去做其他事情。
好像开头扩展得有点多,我收一收,下面会详细说到。有疑问的小伙伴请上车,七淅正式发车了。
1. 各缓冲区
首先 Redis 有什么缓冲区呢?
一共 4 个:
- 客户端输入缓冲区
- 客户端输出缓冲区
- 复制缓冲区
- 复制积压缓冲区
2. 客户端输入缓冲区
服务器端会给每个连接的客户端都设置了一个输入缓冲区。
2.1 作用
暂存请求数据。
输入缓冲区会先把客户端发送过来的命令暂存起来,Redis 主线程再从输入缓冲区中读取命令,进行处理。
为了避免客户端和服务器端的请求发送和处理速度不匹配,这点和等下要说的输出缓冲区是一样的。
2.2 溢出场景
首先缓冲区是一块固定大小的内存区域,如果要把这个地方填满的话,那 Redis 会直接把客户端连接关闭。
保护自己嘛,你客户端挂了总比我服务端挂了好,服务端一挂就是所有客户端都没用了。
那填满缓冲区就有 2 个情况了:
- 要么一下子填满
- 要么生产速度大于消费速度,慢慢被填满
那么把上述原理对应到 Redis 的场景。
一下子填满的情况可以是往 Redis 里写大量数据,百万千万数量级那种。
另一个情况可以是 Redis 服务端因执行耗时操作,阻塞住了,导致没法消费输入缓冲区数据。
2.3 优化
对应上面 2 个溢出场景,优化方向很自然就有了。
一下子填满的情况,是不是可以考虑不要一下子写这么多数据,能否拆下数据(其实一下子写大量数据本身就不合理哈)
另外,是否可以调高缓冲区大小呢?
这个其实是不行的哈,因为没有可以设置的地方,目前服务端默认为每个客户端输入缓冲区分配的大小是 1GB。
那轮到第 2 个溢出场景:两边处理速度不一致。
正常来说,服务端不应该出现长时间阻塞,所以需要看看是什么原因导致的阻塞,解决到就好了。
3. 客户端输出缓冲区
同输入缓冲区,服务器端也会给每个连接的客户端都设置了一个输出缓冲区。
3.1 作用
同上,也是暂存请求数据。
这个地方其实我在文章开头说的,生产者不关心消费者什么时候用,只负责把消费者之前请求的东西处理好就完事了。
可能有点抽象,我是这么理解的,如果有不妥的地方可以留言纠正我一下
服务端一般都会和多个客户端连接,加上 redis 网络通信模块是单线程的(即使是新版本支持多线程也一样)
假如没有输出缓冲区会发生什么事呢?
服务端处理了很多客户端 A 的请求,需要经过网络这一耗时操作,返回给客户端 A。在这个过程中,客户端 B 的请求一直得不到服务端处理和响应,这样吞吐量就上不去了。
有了缓冲区之后,至少能解放服务端,让它去处理客户端 B 的请求。
3.2 溢出场景
这里也是同输入缓冲区,我就不啰嗦了,溢出的话服务端也会关闭客户端连接。
- 服务器端返回了大量数据,一下子填满了
- 返回数据的速度太快,比如执行 MONITOR 命令,它会持续输出监测到的各个命令操作
- 缓冲区大小设置得不合理。
3.3 优化
类似的,不要一下子读大量数据;不持续在线上执行 MONITOR 命令。
而输出缓冲区的大小是可以通过 client-output-buffer-limit 来设置的。
但是一般来说,我们都不用改,因为默认情况就够了,这里了解下就好。
值得说一点的是,Redis 发布订阅的消息也是在该缓冲区中,可以用 client-output-buffer-limit pubsub 8mb 2mb 60
来限制大小。
- pubsub 表示对订阅客户端进行设置。换成 normal 则表示当前设置的是普通客户端
- 整个配置的含义是:实际占用的缓冲区大小要超过 8MB,或者连续 60 秒内对输出缓冲区的写入量超过 2MB 的话,服务端就会关闭客户端连接。
4. 复制缓冲区
温馨提示下,如果对 Redis 同步/复制不了解的读者,比如不知道全量/增量复制,建议可以看下我这篇文章:一文让你明白Redis主从同步。
下面回到正题哈。
有复制肯定有主从,而主从间的数据复制包括全量复制和增量复制两种。
全量复制是同步所有数据,而增量复制只会把主从库网络断连期间主库收到的命令,同步给从库。
4.1 作用
暂存数据。
主节点上会为每个从节点都维护一个复制缓冲区。
在全量复制时,主节点在向从节点传输 RDB 文件的同时,会继续接收客户端发送的写命令请求,并保存在复制缓冲区中,等 RDB 文件传输完成后,再发送给从节点去执行。
4.2 溢出场景
从节点接收和加载 RDB 较慢,同时主节点接收到了大量的写命令,写命令在复制缓冲区中就会越积越多,最后就会溢出。
一旦溢出,主节点会直接关闭和从节点进行复制操作的连接,导致全量复制失败
4.3 优化
可以控制主节点数据量在 2~4GB(仅供参考),这样可以让全量同步执行得更快些,避免复制缓冲区累积过多命令
也可以调整缓冲区大小,还是之前的 client-output-buffer-limit
参数。
比如: config set client-output-buffer-limit slave 512mb 128mb 60
- slave 参数表明该配置项是针对复制缓冲区的.
- 整个配置的含义是:实际占用的缓冲区大小要超过 512MB,或者连续 60 秒内对输出缓冲区的写入量超过 128MB 的话,服务端就会关闭同步连接。
5. 复制积压缓冲区
这个是在新增复制用到的缓冲区。
具体介绍还是推荐看上面提到的文章哈,写到这里也 2k+ 字了,顶不住啦。
5.1 作用
暂存数据。
从节点意外断开连接后重连,可从该缓冲区同步期间没同步到的数据。
5.2 溢出场景
不会溢出。(想不到吧.jpg)
该缓冲区本质是一个固定长度,先进先出的队列,默认 1MB。
所以当队列被占满,不是报错,也不像上面几个缓冲区直接关闭连接。而是覆盖最早进入队列的数据。
因此,如果有从节点还没有同步这些旧命令数据,就会导致主从节点重新进行全量复制,而不是增量复制。
PS:全量复制性能开销远大于增量复制
5.3 优化
调整复制积压缓冲区的大小,参数是:repl_backlog_size
原创不易,如果觉得文章不错,希望能关注下我的公众号:七淅在学Java,文章首发公号。
面试官:Redis中的缓冲区了解吗的更多相关文章
- 搞定面试官 - MySQL 中你知道如何计算一个索引的长度嘛?
大家好,我是程序员啊粥. 今天给大家分享一个我遇到过的比较少见的面试题,那就是 MySQL 中如何计算一个索引的长度. 说实话,我第一次遇到这个问题的时候想当然的以为索引长度就是我们建表时定义的字段长 ...
- 面试官:Redis中字符串的内部实现方式是什么?
在面试间里等候时,感觉这可真暖和呀,我那冰冷的出租屋还得盖两层被子才能睡着.正要把外套脱下来,我突然听到了门外的脚步声,随即门被打开,穿着干净满脸清秀的青年走了进来,一股男士香水的淡香扑面而来. 面试 ...
- 面试官:Redis中列表的内部实现方式是什么?
在面试间里等候时,感觉这可真暖和呀,我那冰冷的出租屋还得盖两层被子才能睡着.正要把外套脱下来,我突然听到了门外的脚步声,随即门被打开,一位眉毛弯弯嘴唇红红的小姐姐走了进来,甜甜的香水味立刻钻进了我的鼻 ...
- 面试官:Redis中哈希数据类型的内部实现方式是什么?
面试官:Redis中基本的数据类型有哪些? 我:Redis的基本数据类型有:字符串(string).哈希(hash).列表(list).集合(set).有序集合(zset). 面试官:哈希数据类型的内 ...
- 面试官:Redis中集合数据类型的内部实现方式是什么?
虽然已经是阳春三月,但骑着共享单车骑了这么远,还有有点冷的.我搓了搓的被冻的麻木的手,对着前台的小姐姐说:"您好,我是来面试的."小姐姐问:"您好,您叫什么名字?&quo ...
- 面试官:Redis中有序集合的内部实现方式是什么?
面试官:Redis中基本的数据类型有哪些? 我:Redis的基本数据类型有:字符串(string).哈希(hash).列表(list).集合(set).有序集合(zset). 面试官:有序集合的内部实 ...
- 面试官:你看过Redis数据结构底层实现吗?
面试中,redis也是很受面试官亲睐的一部分.我向在这里讲的是redis的底层数据结构,而不是你理解的五大数据结构.你有没有想过redis底层是怎样的数据结构呢,他们和我们java中的HashMap. ...
- Redis——面试官考题
总结: 本文在一次面试的过程中讲述了 Redis 是什么,Redis 的特点和功能,Redis 缓存的使用,Redis 为什么能这么快,Redis 缓存的淘汰策略,持久化的两种方式,Redis 高可用 ...
- 面试官问我,Redis分布式锁如何续期?懵了。
前言 上一篇[面试官问我,使用Dubbo有没有遇到一些坑?我笑了.]之后,又有一位粉丝和我说在面试过程中被虐了.鉴于这位粉丝是之前肥朝的粉丝,而且周一又要开启新一轮的面试,为了回馈他长期以来的支持,所 ...
随机推荐
- NSDate分类,把系统返回的时间与现在进行比较---秀清
// // NSDate+Joe.h // WeiBo // // Created by 张秀清 on 15/9/17. // Copyright (c) 2015年 张秀清. All rights ...
- Java基础复习(六)
1. 接口的实现类中的实现接口中的抽象方法的方法必须为public,为什么? 接口中所有的方法与变量都默认是 public 的,在接口中可以不写出来.但在实现类中,如果不明写的话,就变成了 frien ...
- Python编程知识
继承->重写 class A(object): def __init__(self): print("super(B,self).__init__():运行A:init") ...
- 对比redis的RDB、AOF模式的优缺点
一.RDB模式 1.1 工作原理 RDB(Redis DataBase):基于时间的快照,其默认只保留当前最新的一次快照,特点是执行速度比较快,缺点是可 能会丢失从上次快照到当前时间点之间未做快照的数 ...
- JavaEE复制后项目出错或者无法运行的解决方法
eclipse中,直接复制项目,会出现一些错误,解决方法如下: 1,在复制后的工程上点右键->properties->Web Project Settings>web context ...
- Windows系统禁止自动更新
Windows + R键 输入services.msc(服务管理窗口) 找到Windows Update 停止且禁用 恢复->第一次失败 无操作 Windows + r 输入gpedit.msc ...
- (4)Canal多实例使用
1.前言 很多时候,我们很多业务场景可能只需要同步多个或者单个数据库多个或者单个表的数据,canal提供了多实例(Instance)功能让我们可以处理这些业务场景.废话少说,让我们来学习下这块知识点. ...
- python数据分析入门笔记[1]
1.Numpy: Numpy是python科学计算的基础包,它提供以下功能(不限于此): (1)快速高效的多维数组对象naarray (2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数 ( ...
- [LeetCode]2.Add Two Numbers 两数相加(Java)
原题地址: add-two-numbers 题目描述: 给你两个非空的链表,表示两个非负的整数.它们每位数字都是按照逆序的方式存储的,并且每个节点只能存储一位数字. 请你将两个数相加,并以相同形式返回 ...
- 『无为则无心』Python面向对象 — 45、面向对象编程
目录 1.面向对象编程的概念 2.面向对象编程和面向过程编程的区别 (1)面向过程编程 (2)面向对象编程 3.举例理解面向对象 4.Python的面向对象编程 5.面向对象的几大核心特性 1.面向对 ...