事件背景

Redis主从开启AOF,错误操作导致数据被清空。

Redis主要作用:缓存、队列。


事故过程

Redis搭建了主从,持久化方式为RDB,RDB没有定时备份,且AOF都没有开启。

考虑到开启AOF会使Redis安全性更高,所以尝试先在从机做测试,没问题后再上主机。

Redis开启AOF的方式非常简单,打开Redis的conf文件,找到【appendonly】配置项,将【no】改为【yes】重启服务即可。

Redis从机重启后,成功在数据目录生成了百M以上的【appendonly.aof】文件,以该aof文件单独启动Redis实例,生成的数据和单独以RDB文件启动生成的数据一样,因此判断从机AOF配置成功。

接着直接上了主机,Redis主机以同样的方式配置AOF后,结果实例重启的瞬间,Redis主从数据被清空,主从AOF及RDB文件大小接近0M。


问题分析

1、为什么在已经开启RDB持久化的情况下,还打算开启AOF?

解答:同时开启两种持久化,Redis拥有足以媲美PostgreSQL的数据安全性。

RDB 持久化可以在指定的时间间隔内生成数据集的时间点快照,常用做备份。
AOF 持久化记录服务器执行的所有写操作命令,并在服务器启动时,通过重新执行这些命令来还原数据集。 RDB默认的快照保存配置:
save 900 1 #900秒内如果超过1个key被修改,则发起快照保存
save 300 10 #300秒内容如超过10个key被修改,则发起快照保存
save 60 10000 #60秒内容如超过10000个key被修改,则发起快照保存 而AOF默认策略则为每秒钟一次fsync
当然你也可以设置不同的fsync策略,比如无fsync
或者每秒钟一次fsync,或者每次执行写入命令时fsync AOF文件有序地保存了对数据库执行的所有写入操作,
这些写入操作以Redis协议的格式保存。
因此AOF文件的内容非常容易被人读懂,对文件进行分析也很轻松。
导出AOF文件也非常简单:举个例子,如果你不小心执行了 FLUSHALL 命令,
但只要AOF文件未被重写,那么只要停止服务器,
移除AOF文件末尾的FLUSHALL命令,并重启Redis,
就可以将数据集恢复到FLUSHALL执行之前的状态。 有效地利用以上的RDB和AOF特性,能使Redis拥有足以媲美PostgreSQL的数据安全性。

2、为什么在从机AOF配置成功的情况下,主机开启AOF,主从数据瞬间被清空?

解答:首先得明白Redis有这么一个特性,即两种持久化同时开启的情况下,Redis启动默认加载AOF文件恢复数据。

Redis从机由于事先没有开启AOF,配置重启后,从机会生成一个空的AOF文件并默认加载,这时从机数据是空的,但由于配置了主从,从机会同步主机数据,所以你会发现新生成的AOF文件大小在迅速增长。因此Redis从机开启AOF后,数据最终是没有问题的。

这时候Redis主机也配置AOF并重启,主机生成AOF并默认加载,数据瞬间被清空,同时主机RDB发现60秒内有超过10000个key被修改,发起了快照保存,RDB数据也被清空。由于都是内存操作,所以非常快。最后再主从同步,所有数据被删。

3、两种持久化同时开启的情况下,Redis启动为什么默认选择加载AOF而不是RDB文件来恢复数据?

解答:AOF默认策略为每秒钟一次fsync,所以通常情况下,AOF文件所保存的数据相对RDB更完整。

4、AOF 持久化会记录服务器执行的所有写操作命令,那么数据被清空后,为什么不能通过AOF文件的日志记录恢复数据?

解答:Redis会自动地在后台对AOF进行重写,重写后的新AOF文件包含了恢复当前数据集所需的最小命令集合

为什么会重写?

因为AOF记录了服务器执行的所有写操作命令,而RDB本身又是一个非常紧凑的文件
所以对于相同的数据集来说,AOF文件的体积通常要大于RDB文件的体积
而体积大了终究不好,比如Redis重启默认加载AOF文件就要更多的时间

5、面试官如果问你,如何在不用【config set】命令的情况下,将Redis持久化由RDB切换到AOF,你怎么回答?

解答:呵呵,利用主从。。。从机配置AOF重启后,将生成的AOF文件复制至主机Redis数据目录,主机配置AOF后再重启。

注:在 Redis 2.2 或以上版本,通过【config set】可以在不重启的情况下,从 RDB 切换到 AOF。
1)为最新的 dump.rdb 文件创建一个备份。
2)将备份放到一个安全的地方。
3)执行以下两条命令:
redis-cli> CONFIG SET appendonly yes
redis-cli> CONFIG SET save "" 4)确保命令执行之后,数据库的键的数量没有改变。
5)确保写命令会被正确地追加到 AOF 文件的末尾。 步骤 3 执行的第一条命令开启了AOF功能:<font style="color:red">Redis会阻塞直到初始AOF文件创建完成为止</font>,之后Redis会继续处理命令请求, 并开始将写入命令追加到 AOF 文件末尾。
步骤 3 执行的第二条命令用于关闭RDB功能。这一步是可选的,如果你愿意的话,也可以同时使用RDB和AOF这两种持久化功能。 不过别忘了在redis.conf中打开AOF功能!否则的话,服务器重启之后,之前通过【CONFIG SET】设置的配置就会被遗忘,程序会按原来的配置来启动服务器。

Redis开启AOF导致的删库事件的更多相关文章

  1. redis 开启AOF 持久化

    redis 开启AOF 找到redis 安装目录 打开 redis.conf  修改以下参数: appendonly  yes        (默认no,关闭)表示是否开启AOF持久化: append ...

  2. redis 开启AOF

    找到redis 安装目录 例如 cd /usr/local/redis 打开 redis.conf  修改以下参数: # vi /usr/local/redis/etc/redis.conf appe ...

  3. 一个致命的 Redis 命令,导致公司损失 400 万!!

    最近安全事故濒发啊,前几天发生了<顺丰高级运维工程师的删库事件>,今天又看到了 PHP 工程师在线执行了 Redis 危险命令导致某公司损失 400 万.. 什么样的 Redis 命令会有 ...

  4. Redis的KEYS命令引起宕机事件

    摘要: 使用 Redis 的开发者必看,吸取教训啊! 原文:Redis 的 KEYS 命令引起 RDS 数据库雪崩,RDS 发生两次宕机,造成几百万的资金损失 作者:陈浩翔 Fundebug经授权转载 ...

  5. 写了Bug,误执行 rm -fr /*,我删删删删库了,要跑路吗?

    每日英语,每天进步一点点(偷笑): 前言 临近五一节,想到有 5 天假期,小林开始飘了. 写个简单的 Bash 脚本都不上心了,写完连检查都不检查,直接拖到到实体服务器跑. 结果一跑起来,发生不对劲, ...

  6. 【巨杉数据库SequoiaDB】巨杉Tech | “删库跑路”又出现,如何防范数据安全风险?

    最近,又双叕有企业被“删库”了.来自微盟官网的消息,微盟的业务系统数据库(包括主备)遭遇其公司运维人员的删除,系统将停止运营超48小时. 频发的类似事件也让大家对于数据安全的关注不断提高.数据是一个科 ...

  7. [转帖]Redis持久化--Redis宕机或者出现意外删库导致数据丢失--解决方案

    Redis持久化--Redis宕机或者出现意外删库导致数据丢失--解决方案 https://www.cnblogs.com/xlecho/p/11834011.html echo编辑整理,欢迎转载,转 ...

  8. Redis持久化--Redis宕机或者出现意外删库导致数据丢失--解决方案

    echo编辑整理,欢迎转载,转载请声明文章来源.欢迎添加echo微信(微信号:t2421499075)交流学习. 百战不败,依不自称常胜,百败不颓,依能奋力前行.--这才是真正的堪称强大!!! Red ...

  9. 删库到跑路?还得看这篇Redis数据库持久化与企业容灾备份恢复实战指南

    本章目录 0x00 数据持久化 1.RDB 方式 2.AOF 方式 如何抉择 RDB OR AOF? 0x01 备份容灾 一.备份 1.手动备份redis数据库 2.迁移Redis指定db-数据库 3 ...

随机推荐

  1. 关于浏览器对html, js,css的解析先后顺序的理解

    1.首先要了解页面的结构(包含哪些元素?哪些计算机语言能够在页面中运行 ) (1)html          不仅可以包含文字,还可以包含图片.链接,甚至音乐.程序等非文字元素的标记语言       ...

  2. [转]GitHub for Windows 安装失败,An error occurred attempting to install github 的解决办法

    解决办法: 只需要将 http://github-windows.s3.amazonaws.com/GitHub.application http改为https,然后在IE上打开,安装即可 问题如下 ...

  3. 【Android】Android 手机忘记锁屏密码的解决办法

    对于忘记Android锁屏密码的筒子们,除重新刷包或者wipe data外,还可用adb来删除密码: 方法很简单 1.手机连接电脑,不要打开数据连接,在充电模式下进行. 2.在电脑上,解压adb.zi ...

  4. go-无法下载websocket的问题

    由于限制问题,国内使用 go get 安装 golang 官方包可能会失败,如我自己在安装 collidermain 时,出现了以下报错: $ go get collidermain package ...

  5. spark批量写写数据到Hbase中(bulkload方式)

    1:为什么大批量数据集写入Hbase中,需要使用bulkload BulkLoad不会写WAL,也不会产生flush以及split. 如果我们大量调用PUT接口插入数据,可能会导致大量的GC操作.除了 ...

  6. Linux CA证书与https讲解

    1.什么是CA证书. ◇ 普通的介绍信 想必大伙儿都听说过介绍信的例子吧?假设 A 公司的张三先生要到 B 公司去拜访,但是 B 公司的所有人都不认识他,他咋办捏?常用的办法是带公司开的一张介绍信,在 ...

  7. 51Nod1367 完美森林 贪心

    原文链接https://www.cnblogs.com/zhouzhendong/p/51Nod1367.html 题目传送门 - 51Nod1367 题意 有一棵N个点的树,树中节点标号依次为0,1 ...

  8. 51Nod1601 完全图的最小生成树计数 Trie Prufer编码

    原文链接https://www.cnblogs.com/zhouzhendong/p/51Nod1601.html 题目传送门 - 51Nod1601 题意 题解 首先我们考虑如何求答案. 我们将所有 ...

  9. 空间数据可视化:1. 3D_Bar图表| 空间柱状图

    1.Sublime的使用 中文版的配置 https://jingyan.baidu.com/article/ca2d939d1e83feeb6c31cefc.html (百度经验) sublime里边 ...

  10. win 10 slmgr.vbs -xpr 无法运行,被豆麦笔记打开解决方法

    win 10 slmgr.vbs -xpr 无法运行,被豆麦笔记打开解决方法 删除这个豆麦笔记 如果之前已经在 控制面板 程序中卸载过,那么是找不到的,我们先运行 slmgr.vbs -xpr,这个时 ...