前言

Redis是目前非常流行的缓存数据库啦,其中一个主要作用就是为了避免大量请求直接打到数据库,以此来缓解数据库服务器压力;用上缓存难道就高枕无忧了吗?no,no,no,没有这么完美的技术, 缓存穿透、缓存雪崩、缓存击穿这些问题都得好好聊聊。

正文

1. 缓存穿透

1.1 简要描述

缓存穿透是指查找的数据在缓存和数据库中都不存在,导致每一次请求数据从缓存中都获取不到,而将请求打到数据库服务器,但数据库中也没有对应的数据,最后每一次请求都到数据库;如果在高并发场景或有人恶意攻击,就会导致后台数据库服务器压力增大,最终系统可能崩掉。来个直接点的图:

简要说明:

缓存Redis服务器颜色说明:绿色块代表有缓存数据,粉色块代表缓存中没有数据;绿色箭头代表直接从缓存中获取数据;黄色箭头代表穿过缓存从数据库中查数据,但不一定有。

流程大概如下:

  1. 大量客户端发起大量请求到服务器;
  2. 服务器代码逻辑将先经过缓存,如果有缓存数据(绿色部分),直接从缓存中获取数据数据返回;如果缓存中没有数据(粉色部分),请求就会直接打到数据库服务器(如黄色箭头)。
  3. 如果存在大量无缓存数据的请求,最终数据库将因为过大压力而崩掉,导致系统不可用。
1.2 常用解决措施
  • 缓存空值:如果没有在数据库中获取到数据,可以将其对应键的空值进行缓存,并设置较短过期时间;

    优点:在过期时间内直接通过缓存返回空值;从而避免数据库压力;

    缺点:

    消耗Redis内存:如果是攻击者换着非常规的键值请求,如果每次都缓存到Redis中,大量的空数据也占内存空间;

    数据不一致:如果是正常数据,刚开始没有数据,然后将空值进行缓存,并设置短暂的过期时间;如果在过期时间内正常维护了对应的数据,此时取到值仍是空,并没有去数据库中获取新维护数据,导致数据获取不一致。

  • 布隆过滤器

    加一层过滤器进行拦截,判断请求对应的键是否在过滤器中,如果不在就直接返回,不去请求数据库,也不用缓存空值。而布隆过滤器采用bit位的形式标识对应键(每个键进行Hash过后都会得到具体的位置)是否存在,可以用极少的空间标识超大量的数据。

    缺点:布隆过滤器可以判断数据一定不在过滤器中,而对于存在的判断有误判率,因为Hash算法存在冲突的情况。

1.3 布隆过滤器

布隆过滤器不是专门用来针对缓存穿透的,它的应用场景很多,比如避免邮件重发、爬虫软件重爬、视频推送重复等;可能有的小伙伴还不明白为什么可以这么用,那先简单说说布隆过滤器的原理。

瞅个图先:

简要说明:

  1. 先来一个Key,后续需要判断Key是否存在(这里Key可以是任意想存的数据,比如用户ID、视频标识等);

  2. 将Key进行多次hash计算;每次的hash算法得到的结果都不一样;上图只画了三次hash计算,其实实际根据误判率不一样,hash次数就不一样;

  3. 将hash结果对应下标索引的bit位改为1,表示存在; 上图经过三次hash,结果分别为2、5、9,则将对应的位置改为1;

  4. 如果需要判断Key是否在过滤器中,同样需进行多次hash计算,上图为三次,将计算出来的结果作为索引去获取对应的标识,三次中只要有一次对应位置的值为0,那就证明Key不存在过滤器中。 如果是判定存在,则三次的结果对应位置的值应该都为1,不过这样是有误判可能,因为不同的Key,hash的结果有可能是一样的,从而就导致设置对应索引位时就会有冲突,如下图;

    先假设Key1、Key2经过三次hash的结果一样(实际场景是存在的),倘若Key1先来都将2、5、9位置的值设为1,那Key2进来判断存在时,由于hash的结果一样,从而就误判为在过滤器中,其实不存在;

    误判率在布隆过滤器中是可以控制,如果需要降低误判率,那就多进行几次hash计算,那位置相同的概率就降低啦;但这样会影响效率,另外也会有内存的额外开销,hash次数多,需要标识的位就越多。 就算有误判率,也很小,在绝大多数场景下可接受。

1.4 布隆过滤器的使用

既然说Redis,就说Redis的布隆过滤器吧,其实小伙伴可以根据自己的需求利用Redis的bitmap实现。那有没有造好的轮子呢,当然有,在Redis4.0开始就有一个布隆过滤器的组件,开箱即用,当然也有一些其他大佬封装的,基于内存的,基于分布式都有。这里简单说说Redis布隆过滤器的插件,个人觉得挺好的,推荐哦。

官方文档地址:https://oss.redislabs.com/redisbloom/

我这面是用centos进行演示,主要步骤如下:

  1. 如果没有git的需要安装一下;如果不用git就去下载代码压缩包;

    yum install -y git
  2. 把redis布隆过滤器的源码搞下来,这里用git;也可以通过下载的方式;

    git clone https://github.com/RedisLabsModules/redisbloom.git
  3. 进入代码目录进行make(生成redisbloom.so文件),如果make命令找不到,就需要安装VC++编译相关的包;

    cd redisbloom
    make
  4. 在Redis配置文件中配置加载redisbloom插件,然后重启就可以用啦;也可以启动的时候指定加载插件运行;

    配置文件方式式:在配置文件中添加如下配置,需要指定redisbloom.so具体的文件位置。

    然后指定配置文件启动即可;

    ./redis-server redis.conf

    启动时指定模块运行方式:

    ./redis-server --loadmodule ./redisbloom.so
  5. 简单使用

    命令使用和常规命令一样啦,就不需要我再写程序了吧,如果非要的话,那就简单说两句:

    A.将需要判断数据保存在过滤器中,比如所有的用户id;

    B.当请求过来时就先从过滤器中判断有无数据,没有直接返回,不去缓存,也不去数据库;

    C.如果有新添加的用户,需要将新的用户id放到过滤器中;

关于Redis布隆过滤器还有一些命令没说,小伙伴可以去逛逛官网。有小伙伴说,不用这个插件行吗,当然行啊,可以自己实现嘛,不过有些小伙伴有封装好的包啦,有基于内存的,也有基于Redis的,如下图:

代码我就不上了,剩下的就留给小伙伴啦。

2. 缓存雪崩

1.1 简要描述

缓存雪崩是指突然缓存层不可用,导致大量请求直接打到数据库,最终由于数据库压力过大可能导致系统崩掉。缓存层不可用指以下两方面:

  • 缓存服务器宕机,系统将请求打到数据库;
  • 缓存数据突然大范围集中过期失效,导致大量请求打到数据库重新加载数据;

如图:

简要说明:

缓存Redis服务器颜色说明:绿色块代表有缓存数据,粉色块代表缓存中没有数据;白色块代表大范围失效的缓存数据,绿色箭头代表直接从缓存中获取数据;黄色箭头代表穿过缓存从数据库中查数据。

流程大概如下:

  1. 大量客户端发起大量请求到服务器;
  2. 服务器代码逻辑将先经过缓存,如果有缓存数据(绿色部分),直接从缓存中获取数据数据返回;如果缓存过期(白色块部分),请求就会直接打到数据库服务器(如黄色箭头)
  3. 如果存在大量热数据的请求,但热数据又大范围过期,最终数据库将因为过大压力崩掉,导致系统不可用。
1.2 常用解决措施
  • 缓存预热:在高峰期还没到来时,提前将热数据加载到缓存中,避免高峰期来临时数据库压力过大。
  • 均匀设置过期时间:针对不同的热点数据,将过期时间加上一个随机值,让过期时间不集中在一个点,从而减小很大部分数据库压力;
  • 多级缓存:除了使用Redis缓存,还可以根据业务增加一些热点数据的其他缓存,比如内存缓存,可以将各级的缓存有效期分开,这种方式也能缓解数据库的压力;
  • 限流、降级:如果压力过大,避免把系统搞崩,可以增加一些限流手段,不管是中间件还是消息队列等,主要保证系统的可用。
  • 加互斥锁:目的就是加锁独占操作,让一个操作向缓存中重新加载数据,让请求操作等待,其实这样的体验不好,慎用。如果要用,要超级注意锁的性能和稳定性。
  • 对于缓存层整体崩掉的情况:使用高可用架构,比如之前说到的主从复制、哨兵、集群,根据需求进行对应架构,保证缓存层不崩掉。

3. 缓存击穿

1.1 简要描述

缓存击穿是指在超级热点数据突然过期,导致针对超级热点的数据请求在过期期间直接打到数据库,这样数据库服务器会因为某一超热数据导致压力过大而崩掉。

超热数据:比如秒杀时的数据,某宝、某东、某多多这种平台的数据如果在秒杀时间段失效,请求量足矣让数据库崩掉。

如图:

简要说明:

缓存Redis服务器颜色说明:绿色块代表有缓存数据,粉色块代表缓存中没有数据;白色圈代表超级热点缓存数据过期失效,绿色箭头代表直接从缓存中获取数据;黄色箭头代表穿过缓存从数据库中查数据。

流程大概如下:

  1. 大量客户端发起大量请求到服务器;
  2. 服务器代码逻辑将先经过缓存,如果有缓存数据(绿色部分),直接从缓存中获取数据数据返回;如果超热缓存数据过期(白色圈部分),请求就会直接打到数据库服务器(如黄色箭头)
  3. 超级热点数据过期失效,如秒杀数据,如果在秒杀时段失效,最终数据库将因为过大压力崩掉,导致系统不可用。

注:这个只是针对超热点数据,而不是大范围数据。

1.2 常用解决措施
  • 热点数据不过期:像这种超热数据就设置永不过期。避免过期失效让数据库压力过大而崩。
  • 加互斥锁:目的就是加锁,然后向缓存中重新加载数据,让请求等待,其实这样的体验不好,慎用。如果要用,要超级注意锁的性能和稳定性。

总结

缓存穿透、缓存雪崩、缓存击穿不管是哪个问题,其主要原因还是在缓存层没有命中,将请求直接打到数据库啦,最终导致数据库压力过大,系统不可用。小伙伴根据系统需要进行问题处理,没有完美的解决方案,但总会有一种适合需求的方案,解决业务问题才是真正目的。

今天没有上代码,相信小伙伴都能根据解决措施写出对应的代码,分布式锁可能稍微有点难搞,下次抽时间给大家安排上。

关于Redis系列,下篇说说Lua脚本就算初步完成啦,剩下的就是实战的总结啦,在项目的使用过程中,如果有好的方案和棘手的问题都会和小伙伴分享。接下来数据库优化系列即将开启,主要针对MySql。

这篇文章特意安排在元宵发布,熬夜到两点,就是为了祝小伙伴元宵节快乐。

一个被程序搞丑的帅小伙,关注"Code综艺圈",跟我一起学~~~

Redis缓存穿透、缓存雪崩、缓存击穿好好说说的更多相关文章

  1. 缓存穿透、雪崩、热点与Redis

    (拼多多问:Redis雪崩解决办法) 导读:互联网系统中不可避免要大量用到缓存,在缓存的使用过程中,架构师需要注意哪些问题?本文以 Redis 为例,详细探讨了最关键的 3 个问题. 一.缓存穿透预防 ...

  2. Redis缓存穿透和雪崩

    缓存穿透 用户想要查询一个数据 在redis缓存数据库中没有获取到 就会向后端的数据库中查询. 当用户很多 都去访问后端数据库的话,这就会给数据库带来很大的压力. 常见场景:秒杀活动 等 解决方法: ...

  3. Redis系列(八)--缓存穿透、雪崩、更新策略

    1.缓存更新策略 1.LRU/LFU/FIFO算法剔除:例如maxmemory-policy 2.超时剔除,过期时间expire,对于一些用户可以容忍延时更新的数据,例如文章简介内容改了几个字 3.主 ...

  4. redis的穿透和雪崩

    穿透: 从缓存中查询一个数据,查到为空,需要每次都去数据库中查询.而从数据库中查询出来也为空,也就不写入缓存.导致一个不存在的数每次都去数据库中查询,造成db系统很大压力 造成缓存穿透 解决:如果从数 ...

  5. 深入了解Redis(7)-缓存穿透,雪崩,击穿

    redis作为一个内存数据库,在生产环境中使用会遇到许多问题,特别是像电商系统用来存储热点数据,容易出现缓存穿透,雪崩,击穿等问题.所以实际运用中需要做好前期处理工作. 一.缓存雪崩 1.概念 缓存雪 ...

  6. SpringBoot微服务电商项目开发实战 --- Redis缓存雪崩、缓存穿透、缓存击穿防范

    最近已经推出了好几篇SpringBoot+Dubbo+Redis+Kafka实现电商的文章,今天再次回到分布式微服务项目中来,在开始写今天的系列五文章之前,我先回顾下前面的内容. 系列(一):主要说了 ...

  7. redis缓存, 缓存击穿,缓存雪崩,缓存穿透

    在实际项目中,MySQL数据库服务器有时会位于另外一台主机,需要通过网络来访问数据库:即使应用程序与MySQL数据库在同一个主机中,访问MySQL也涉及到磁盘IO操作(MySQL也有一些数据预读技术, ...

  8. Redis缓存雪崩、击穿、穿透

    参考大佬 前言 Redis在互联网技术存储方面使用如此广泛,几乎所有的后端技术面试官都要在Redis的使用和原理方面对小伙伴们进行360°的刁难.作为一个在互联网公司面一次拿一次offer的面霸(请允 ...

  9. Redis缓存击穿、缓存穿透、缓存雪崩

    文章原创于公众号:程序猿周先森.本平台不定时更新,喜欢我的文章,欢迎关注我的微信公众号. 上篇文章谈到了Redis分布式锁,实际上就是为了解释为什么做缓存采用Redis而不使用map/guava.缓存 ...

  10. Redis系列三 - 缓存雪崩、击穿、穿透

    前言 从学校出来,做开发工作也有一定时间了,最近有想系统地进一步深入学习,但发现基础知识不够扎实,故此来回顾基础知识,进一步巩固.加深印象. 最初开始接触编程时,总是自己跌跌撞撞.不断摸索地去学习,再 ...

随机推荐

  1. 通过SignalR技术整合即时通讯(IM)在.NET中应用落地

    1.引言 即时通讯(IM)是RDIFramework.NET敏捷开发框架全新提供的一个基于Web的即时通讯.内部聊天沟通的工具.界面美观大方对于框架内部进行消息的沟通非常方便.基于RDIFramewo ...

  2. zjnu1725 COCI (类似二维树状数组模拟)

    Description The 3rd round of COCI is already here! In order to bet on predict the scores, we have as ...

  3. AtCoder Beginner Contest 188 C - ABC Tournament (模拟)

    题意:有\(2^n\)个人站成一排比赛,刚开始每个人都和自己右边的人进行比赛,赢得人晋级下一轮(下标的小的在前面),不断重复这个过程,问最后拿到第二名的人的编号. 题解:根据题意,可以用vector直 ...

  4. MySQL 启动流程及配置管理

    目录 MySQL 启动关闭流程 启动数据库 关闭数据库 MySQL 配置管理 预编译阶段 配置文件 命令行 MySQL 配置文件 配置文件的位置和优先级 配置文件的优先级测试 配置文件的生效顺序 配置 ...

  5. codeforces 9D(非原创)

    D. How many trees? time limit per test 1 second memory limit per test 64 megabytes input standard in ...

  6. 自己yy的中缀表达式转后缀表达式(未验证完全正确)

    目前自己测试的表达式都没有出过问题 思路是这样,先将后缀表达式的计算顺序搞出来..当完全缩出来一个数的时候,如果后面还有要计算的,我们就把它放到后缀表达式的后面 先算后面的..不断迭代.. #incl ...

  7. Google PageSpeed Insights : 网站性能优化检测工具

    1 1 https://developers.google.com/speed/pagespeed/insights/ PageSpeed Insights 使您的网页在所有设备上都能快速加载. 分析 ...

  8. ES6 Map All In One

    ES6 Map All In One Map 字典/地图 Set 集合 https://developer.mozilla.org/en-US/docs/Web/JavaScript/Referenc ...

  9. SwiftUI & Compose View

    SwiftUI & Compose View OK // // ContentView.swift // Landmarks // // Created by 夏凌晨 on 2020/10/2 ...

  10. ES6 arrow function vs ES5 function

    ES6 arrow function vs ES5 function ES6 arrow function 与 ES5 function 区别 this refs xgqfrms 2012-2020 ...