AppBoxFuture的存储引擎依赖Raft一致性协议来保证各个分区副本的一致性，如果不处理Raft日志将不断增长，因此需要特定的机制（定期或每处理一定数量的日志）来回收那些无用的日志数据。通过学习Raft协议内的Log Compaction，并参考TiKV等实现，作者初步实现了分区快照与日志截断回收功能。

一、快照流程：

每个分区对应一个Raft组，由不同的Raft节点分布在集群的不同机器上，每个RaftNode都在循环处理Ready（如下图所示）:

在达到快照创建条件时（上图步骤6），即满足一定周期（如6小时）且期间应用的已递交日志数量达到阈值（如10000条），RaftNode通知对应的状态机创建快照，这里主要是利用RocksDB的Snapshot及SstFileWriter将当前分区所涉及的KV数据写入相应的sst文件内。在状态机创建快照成功后，RaftNode通知对应的RaftStorage截断并回收日志，由于目前Raft日志同样使用RocksDB存储，所以可以利用RocksDB的DeleteRange功能批量删除无用的日志。
如果同一Raft组内的某一节点所在的机器Down机了较长的时间，在此期间此组内的Leader达到快照条件创建了快照并回收了日志。之后Down掉的机器重新启动，Follower与Leader通信后要求追加Down机期间的日志，但Leader快照前的日志已删除，Leader会发送Raft快照给Follower，这里需要注意的是Leader先发送状态机创建的各个sst文件，都发送完了再发送RaftSnapshot消息。
Follower在收到快照消息时（上图步骤3），先清理当前分区所涉及的所有旧数据，然后通知对应的状态机恢复快照数据，这里主要是利用RocksDB的IngestExternalFile将各个sst文件快速导入存储内。

创建与接收的快照文件目前存储在运行时snapshot目录内。

二、简单测试：

1. 启动集群并新建测试用实体模型

参考前篇“告别单体架构，迎接分布式时代”启动一个新集群，并且登录至IDE创建新实体。

2. 关闭集群某一节点模拟Down机

直接Control+C关闭某一节点。

3. 新建一个服务插入5000条记录

在IDE内新建服务用于插入5000条记录（用于触发快照条件），调用此服务后可看到控制台输出如下图所示的创建快照日志。

4. 重新启动Down机节点

通过如下命令重启Down机节点，可看到控制台输出如下图所示的恢复快照日志。

sudo ./appbox

5. 验证Down机节点快照恢复

通过tools/dbscan工具查看快照数据是否已恢复。

tools/dbscan --db=data(数据所在目录) --cf=TableCF --take=10000 --prefix=000020017000

dbscan的参数--prefix=十六进制字串，可以只匹配相同前缀的KV记录

三、本篇小结：

本篇介绍了Raft快照及日志截断回收的流程及相应的测试，GitHub上的运行时已更新可供测试。作者开发AppBoxFuture到十月一日就整一年了，期间曾多次想放弃，好在顶着巨大的压力总算解决了这最后一个技术难点，到此基本上原型验证是没有大问题了，下一步的重点是完善必要功能、稳定性及性能优化，并且考虑是开源该项目还是商业化运作。

AppBoxFuture: Raft快照及日志截断回收的更多相关文章

SQL Server 事务日志截断、回绕与收缩（转载）
每个 SQL Server 数据库都具有事务日志,用于记录所有事务以及每个事务对数据库所做的修改. 必须定期截断事务日志以避免它被填满. 但是,一些因素可能延迟日志截断,因此监视日志大小很重要. 某些 ...
SQL Server 日志截断
截断事务日志是逻辑操作,只是把日志的一部分标记为‘不再需要’所以可以重用这个空间,截断不是物理操作,不会减少磁盘上文件的大小, 要减小物理大小必定要进行收缩. ----------- 有时就算是备份都 ...
Flume 自定义拦截器多行读取日志+截断
前言: Flume百度定义如下: Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集.聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据:同时,F ...
SQL Server 2012 清理日志截断日志的方法
MEDIA数据库名 ALTER DATABASE MEDIA SET RECOVERY SIMPLE WITH NO_WAIT ALTER DATABASE MEDIA SET RECOVERY SI ...
rsyslog 解决日志截断不读取问题
reopenOnTruncate [on/off] (requires v8.16.0+) Default: off 这是一个实验性的东西告诉rsyslog 重新input file 当它被trunc ...
SqlServer 2012 清理日志截断日志的方法
ALTER DATABASE test SET RECOVERY SIMPLE WITH NO_WAITALTER DATABASE test SET RECOVERY SIMPLE --简单模式DB ...
MIT 6.824 Lab2D Raft之日志压缩
书接上文Raft Part C | MIT 6.824 Lab2C Persistence. 实验准备实验代码:git://g.csail.mit.edu/6.824-golabs-2021/src ...
Raft 实现日志复制同步
Raft 实现日志复制同步本篇文章以 John Ousterhout(斯坦福大学教授) 和 Diego Ongaro(斯坦福大学获得博士学位,Raft算法发明人) 在 Youtube 上的讲解视频及 ...
SQL 2008 R2数据库变为REPLICATION，日志不断增长并且不能截断和收缩的解决方式
执行环境:windows server2003,sql server2008 R2,数据库上布置CDC 用户反应系统报错是日志已满,系统不能执行. 查看日志文件时.发现日志文件已经达到15G ...

随机推荐

CentOS -- Zookeeper installation and configure
1 JDK 1.8 must installed first 2 Get Zookeeper package wget https://archive.apache.org/dist/zookeepe ...
volatile底层实现原理
前言当共享变量被声明为volatile后,对这个变量的读/写操作都会很特别,下面我们就揭开volatile的神秘面纱. 1.volatile的内存语义 1.1 volatile的特性一个volat ...
SpringCloud之Feign
[前面的话]书接上文,本文的某些知识依赖我的第一篇SpringCLoud的文章:SpringCloud之Eureka,如果没有看过可以先移步去看一下.另外在微服务架构中,业务都会被拆分成一个个独立的服 ...
SCRUM的四大支柱
转自:http://www.scrumcn.com/agile/scrum-knowledge-library/scrum.html#tab-id-9 迭代开发在Scrum的开发模式下,我们将开发周 ...
P3355 骑士共存问题二分建图 + 当前弧优化dinic
P3355 骑士共存问题题意: 也是一个棋盘,规则是“马”不能相互打到. 思路: 奇偶点分开,二分图建图,这道题要注意每个点可以跑八个方向,两边都可以跑,所以边 = 20 * n * n. 然后di ...
HDU dp递推母牛的故事 *
母牛的故事 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submi ...
gulp的介绍和手动安装
gulp, 前端自动化工具, 文件操作, 项目上线之前,将碎片文件合并,将ES6转成ES5,文件压缩,快速搭建服务器... gulp基于node环境 gulp就是node的一个非内置的小模块 gulp ...
Docker笔记（十）：使用Docker来搭建一套ELK日志分析系统
一段时间没关注ELK(elasticsearch —— 搜索引擎,可用于存储.索引日志, logstash —— 可用于日志传输.转换,kibana —— WebUI,将日志可视化),发现最新版已到7 ...
Linux服务器部署JavaWeb项目完整教程
本文大部分参考网上其他教程,是实际操作后回过头来的一些总结,希望可以对正在部署项目的你有所帮助. 基本环境:Centos7.tomcat8.jdk8,MySQL5.6.nginx 安装JDK yum ...
unicode编码原理及问题
历史在1963年,计算机的使用尚不广泛,那时使用的是7-bit的ASCII码,范围为0-127作为字符的编码,只支持少部分的字符,但是随着计算机的普及,不同的国家地区开始自己制造自己的编码规范,这导致 ...

AppBoxFuture: Raft快照及日志截断回收