本文首发于:https://mp.weixin.qq.com/s/je4nqCIq6ARhSV2V5Ymmtg

微信公众号:后端技术指南针

0.概述

通过本文将了解到以下内容:

  • Redis服务器采用单线程模型的原因
  • Redis单线程处理文件事件和时间事件
  • Redis事件的执行和调度

1.Redis的单线程模式

  • 单线程的现状

本质上Redis并不是单纯的单线程服务模型,一些辅助工作比如持久化刷盘、惰性删除等任务是由BIO线程来完成的,这里说的单线程主要是说与客户端交互完成命令请求和回复的工作线程。

  • 单线程的原因

至于Antirez大佬当时是怎么想的设计为单线程不得而知,只能从几个角度来分析,来确定单线程模型的选择原因:

  • CPU并非瓶颈

多线程模型主要是为了充分利用多核CPU,让线程在IO阻塞时被挂起让出CPU使用权交给其他线程,充分提高CPU的使用率,但是这个场景在Redis并不明显,因为CPU并不是Redis的瓶颈,Redis的所有操作都是基于内存的,处理事件极快,因此使用多线程来切换线程提高CPU利用率的需求并不强烈;

  • 内存才是瓶颈

单个Redis实例对单核的利用已经很好了,但是Redis的瓶颈在于内存,设想64核的机器假如内存只有16GB,那么多线程Redis有什么用武之地?

  • 复杂的Value类型

Redis有丰富的数据结构,并不是简单的Key-Value型的NoSQL,这也是Redis备受欢迎的原因,其中常用的Hash、Zset、List等结构在value很大时,CURD的操作会很复杂,

如果采用多线程模式在进行相同key操作时就需要加锁来进行同步,这样就可能造成死锁问题。

这时候你会问:将key做hash分配给相同的线程来处理就可以解决呀,确实是这样的,这样的话就需要在Redis中增加key的hash处理以及多线程负载均衡的处理,

从而Redis的实现就成为多线程模式了,好像确实也没有什么问题,但是Antirez并没有这么做,大神这么做肯定是有原因的,果不其然,我们见到了集群化的Redis;

  • 集群化扩展

目前的机器都是多核的,但是内存一般128GB/64GB算是比较普遍了,但是Redis在使用内存60%以上稳定性就不如50%的性能了(至少笔者在使用集群化Redis时超过70%时,集群failover的频率会更高),

因此在数据较大时,当Redis作为主存,就必须使用多台机器构建集群化的Redis数据库系统,这样以来Redis的单线程模式又被集群化的处理所扩展了;

  • 软件工程角度

单线程无论从开发和维护都比多线程要容易非常多,并且也能提高服务的稳定性,无锁化处理让单线程的Redis在开发和维护上都具备相当大的优势;

  • 类Redis系统:

Redis的设计秉承实用第一和工程化,虽然有很多理论上优秀的设计模式,但是并不一定适用自己,软件设计过程就是权衡的过程。

业内也有许多类Redis的NoSQL,比如360基础架构组开发的Pika系统,基于SSD和Rocks存储引擎,上层封装一层协议转换,来实现Redis所有功能的模拟,感兴趣的可以研究和使用。

2.单线程的文件事件和时间事件

Redis作为单线程服务要处理的工作一点也不少,Redis是事件驱动的服务器,主要的事件类型就是:

  1. 文件事件类型
  2. 时间事件类型

其中,时间事件是理解单线程逻辑模型的关键。

  • 时间事件

Redis的时间事件分为两类:

  1. 定时事件:任务在等待指定大小的等待时间之后就执行,执行完成就不再执行,只触发一次;
  2. 周期事件:任务每隔一定时间就执行,执行完成之后等待下一次执行,会周期性的触发;
  3. 周期性时间事件

Redis中大部分是周期事件,周期事件主要是服务器定期对自身运行情况进行检测和调整,从而保证稳定性HA,这项工作主要是ServerCron函数来完成的,周期事件的内容主要包括:

  1. 删除数据库的key
  2. 触发RDB和AOF持久化
  3. 主从同步
  4. 集群化保活
  5. 关闭清理死客户端链接
  6. 统计更新服务器的内存、key数量等信息

可见 Redis的周期性事件虽然主要处理辅助任务,但是对整个服务的稳定运行,起到至关重要的作用。

  • 时间事件的无序链表

Redis的每个时间事件分为三个部分:

  1. 事件ID 全局唯一 依次递增
  2. 触发时间戳 ms级精度
  3. 事件处理函数 事件回调函数

时间事件Time_Event结构:

Redis的时间事件是存储在链表中的,并且是按照ID存储的,新事件在头部旧事件在尾部,但是并不是按照即将被执行的顺序存储的。

也就是第一个元素50ms后执行,但是第三个可能30ms后执行,这样的话Redis每次从链表中获取最近要执行的事件时,都需要进行O(N)遍历,

显然性能不是最好的,最好的情况肯定是类似于最小栈MinStack的思路,然而Antirez大佬却选择了无序链表的方式。

选择无序链表也是适合Redis场景的,因为Redis中的时间事件数量并不多,即使进行O(N)遍历性能损失也微乎其微,也就不必每次插入新事件时进行链表重排。

Redis存储时间事件的无序链表如图:

3.单线程下事件的调度和执行

Redis服务中因为包含了时间事件和文件事件,事情也就变得复杂了,服务器要决定何时处理文件事件、何时处理时间事件、并且还要明确知道处理时间的时间长度,因此事件的执行和调度就成为重点。

Redis服务器会轮流处理文件事件和时间事件,这两种事件的处理都是同步、有序、原子地执行的,服务器也不会终止正在执行的事件,也不会对事件进行抢占。

  • 事件执行调度规则

文件事件是随机出现的,如果处理完成一次文件事件后,仍然没有其他文件事件到来,服务器将继续等待,

在文件事件的不断执行中,时间会逐渐向最早的时间事件所设置的到达时间逼近并最终来到到达时间,

这时服务器就可以开始处理到达的时间事件了。由于时间事件在文件事件之后执行,并且事件之间不会出现抢占,

所以时间事件的实际处理时间一般会比设定的时间稍晚一些。

  • 事件执行调度的代码实现

Redis源码ae.c中对事件调度和执行的详细过程在aeProcessEvents中实现的,具体的代码如下:

 int aeProcessEvents(aeEventLoop *eventLoop, int flags)
 {
   , numevents;
   if (!(flags & AE_TIME_EVENTS) && !(flags & AE_FILE_EVENTS))
     ;

    ||
     ((flags & AE_TIME_EVENTS) && !(flags & AE_DONT_WAIT))) {
     int j;
     aeTimeEvent *shortest = NULL;
     struct timeval tv, *tvp;

     if (flags & AE_TIME_EVENTS && !(flags & AE_DONT_WAIT))
       shortest = aeSearchNearestTimer(eventLoop);
     if (shortest) {
       long now_sec, now_ms;
       aeGetTime(&now_sec, &now_ms);
       tvp = &tv;
       long long ms =
         (shortest->when_sec - now_sec)* +
         shortest->when_ms - now_ms;

       ) {
         tvp->tv_sec = ms/;
         tvp->tv_usec = (ms % )*;
       } else {
         tvp->tv_sec = ;
         tvp->tv_usec = ;
       }
     } else {
       if (flags & AE_DONT_WAIT) {
         tv.tv_sec = tv.tv_usec = ;
         tvp = &tv;
       } else {
         tvp = NULL; /* wait forever */
       }
     }
     numevents = aeApiPoll(eventLoop, tvp);
     if (eventLoop->aftersleep != NULL && flags & AE_CALL_AFTER_SLEEP)
       eventLoop->aftersleep(eventLoop);

     ; j < numevents; j++) {
       aeFileEvent *fe = &eventLoop->events[eventLoop->fired[j].fd];
       int mask = eventLoop->fired[j].mask;
       int fd = eventLoop->fired[j].fd;
       ;
       int invert = fe->mask & AE_BARRIER;
       if (!invert && fe->mask & mask & AE_READABLE) {
         fe->rfileProc(eventLoop,fd,fe->clientData,mask);
         fired++;
       }
       if (fe->mask & mask & AE_WRITABLE) {
         if (!fired || fe->wfileProc != fe->rfileProc) {
           fe->wfileProc(eventLoop,fd,fe->clientData,mask);
           fired++;
         }
       }
       if (invert && fe->mask & mask & AE_READABLE) {
         if (!fired || fe->wfileProc != fe->rfileProc) {
           fe->rfileProc(eventLoop,fd,fe->clientData,mask);
           fired++;
         }
       }
       processed++;
     }
   }
   /* Check time events */
   if (flags & AE_TIME_EVENTS)
     processed += processTimeEvents(eventLoop);
   return processed;
 }
  • 事件执行和调度的伪码

上面的源码可能读起来并不直观,在《Redis设计与实现》书中给出了伪代码实现:

 def aeProcessEvents()
   #获取当前最近的待执行的时间事件
   time_event = aeGetNearestTimer()
   #计算最近执行事件与当前时间的差值
   remain_gap_time = time_event.when - uinx_time_now()
   #判断时间事件是否已经到期 则重置 马上执行
   :
     remain_gap_time =
   #阻塞等待文件事件 具体的阻塞等待时间由remain_gap_time决定
   #如果remain_gap_time为0 那么不阻塞立刻返回
   aeApiPoll(remain_gap_time)
   #处理所有文件事件
   ProcessAllFileEvent()
   #处理所有时间事件
   ProcessAllTimeEvent()

可以看到Redis服务器是边阻塞边执行的,具体的阻塞事件由最近待执行时间事件的等待时间决定的,在阻塞该最小等待时间返回之后,开始处理事件任务,

并且先执行文件事件、再执行时间事件,所有即使时间事件要即刻执行,也需要等待文件事件完成之后再执行时间事件,所以比预期的稍晚。

  • 事件调度和执行流程

4.参考资料

    • 深入了解Redis之事件原理和实现
    • 《Redis设计与实现》黄健宏

理解Redis单线程运行模式的更多相关文章

  1. 理解Redis的反应堆模式

    1. Redis的网络模型 Redis基于Reactor模式(反应堆模式)开发了自己的网络模型,形成了一个完备的基于IO复用的事件驱动服务器,但是不由得浮现几个问题: 为什么要使用Reactor模式呢 ...

  2. 深入理解PHP的运行模式

    PHP运行模式有4钟:1)cgi 通用网关接口(Common Gateway Interface))2) fast-cgi 常驻 (long-live) 型的 CGI3) cli  命令行运行   ( ...

  3. redis 单线程的理解

    单线程模型 Redis客户端对服务端的每次调用都经历了发送命令,执行命令,返回结果三个过程.其中执行命令阶段,由于Redis是单线程来处理命令的,所有每一条到达服务端的命令不会立刻执行,所有的命令都会 ...

  4. 【原】Spark不同运行模式下资源分配源码解读

    版权声明:本文为原创文章,未经允许不得转载. 复习内容: Spark中Task的提交源码解读 http://www.cnblogs.com/yourarebest/p/5423906.html Sch ...

  5. 理解Redis的单线程模式

    0.概述 本文基于的Redis版本为4.0以下,在Redis更高版本中并不是完全的单线程了,增加了BIO线程,本文主要讲述主工作线程的单线程模式. 通过本文将了解到以下内容: Redis服务器采用单线 ...

  6. 【转载】PHP运行模式的深入理解

    PHP运行模式的深入理解 作者: 字体:[增加 减小] 类型:转载 时间:2013-06-03我要评论 本篇文章是对PHP运行模式进行了详细的分析介绍,需要的朋友参考下   PHP运行模式有4钟:1) ...

  7. 理解Spark运行模式(三)(STANDALONE和Local)

    前两篇介绍了Spark的yarn client和yarn cluster模式,本篇继续介绍Spark的STANDALONE模式和Local模式. 下面具体还是用计算PI的程序来说明,examples中 ...

  8. 理解Spark运行模式(二)(Yarn Cluster)

    上一篇说到Spark的yarn client运行模式,它与yarn cluster模式的主要区别就是前者Driver是运行在客户端,后者Driver是运行在yarn集群中.yarn client模式一 ...

  9. 理解Spark运行模式(一)(Yarn Client)

    Spark运行模式有Local,STANDALONE,YARN,MESOS,KUBERNETES这5种,其中最为常见的是YARN运行模式,它又可分为Client模式和Cluster模式.这里以Spar ...

随机推荐

  1. Swagger Learing - Spring Boot 整合swagger

    学习了一下swagger. 这是编写的Demo 源码 https://github.com/AmberBar/Learning/tree/master/swagger-learning/swagger ...

  2. 算法随笔-二叉树遍历的N种姿势

    最近在练习用Python刷算法,leetcode上刷了快300题.一开始怀疑自己根本不会写代码,现在觉得会写一点点了,痛苦又充实的刷题历程.对我这种半路出家的人而言,收获真的很大. 今天就从二叉树遍历 ...

  3. 【Java】遍历List/Set/Map集合的一些常用方法

    /* * 遍历List/Set/Map集合的一些常用方法 */import java.util.ArrayList;import java.util.HashMap;import java.util. ...

  4. 微信公众号 访问403问题,样式错乱,js失效

    我服了,还是那个微信公众号小项目. 这个项目用的是ssm+velocity 问题的是,有时候页面加载会乱,js,css都加载不出来. 这个问题也是很久了,前几天开会,那个甲方医院很不开心,说是要找下家 ...

  5. django-Views之类视图 (六)

    book/urls.py from django.urls import path from . import views urlpatterns = [ path('',views.IndexVie ...

  6. 设计模式C++描述----18.中介者(Mediator)模式

    一. 举例 比如,现在中图和日本在关于钓鱼岛问题上存在争端.这时,联合国就会站出来,做为调解者,其实也没什么好调解的,钓鱼岛本来就是中国的,这是不争的事实!联合国也就是个传话者.发言人. 结构图如下: ...

  7. SYZOJ中文安装指南

    Made By:Spaceskynet Thanks to other developers. 测试系统 Ubuntu-17.04 PS(全局变量): [syzoj2 path] = 您git的syz ...

  8. 汇编语言——物理地址=段地址x16+偏移地址,检测点2.2

    一.为什么 物理地址=段地址x16+偏移地址? 刚开始学时,我都笨到不明白为什么是2的N次方,咱把物理地址就当数字,计算机中数字是由很多位0或1自由组合的, 而每一位上要么是0要么是1,只有这两种情况 ...

  9. ElasticSearch head插件安装与配置

    下载 下载地址:https://github.com/mobz/elasticsearch-head 安装 1. 下载到本地 git clone 2. 安装 grunt npm install -g ...

  10. 在线API文档管理工具Simple doc

    Simple doc是一个简易的文档发布管理工具,为什么要写Simple doc呢?主要原因还是github的wiki并不好用:没有目录结构,文章没有Hx标签索引,最悲剧的是文章编辑的时候不能直接图片 ...