Linux：保证数据安全落盘

背景

在很多IO场景中，我们经常需要确保数据已经安全的写到磁盘上，以便在系统宕机重启之后还能读到这些数据。但是我们都知道，linux系统的IO路径还是很复杂的，分为很多层，每一层都可能会有buffer来加速IO读写。同时，用户态的应用程序和库函数也可能拥有自己的buffer，这又给IO路径增加了一些复杂性。可见，要想保证数据安全的写到磁盘上，并不是简单调一个write/fwrite就可以搞定的。
那么要怎么做呢？很多人会想到很多办法，比如：fflush()、fsync()、fdatasync()、sync()、open()使用O_DIRECT或O_SYNC标志等。嗯，这些手段（或者某些组合）的确可以保证数据安全的持久化，那么它们之间有什么区别呢？fflush()和fsync()有啥区别？O_DIRECT是啥意思，它可以保证数据安全的持久化吗？O_DIRECT和O_SYNC区别什么？O_SYNC和fsync()呢？fsync能完成msync的功能吗？本文将试图理解、解释这些概念的作用和区别。

Linux IO

所谓一图胜千言，为了解析清楚这些概念的区别，我特意画了一张图，仔细看，应该可以清晰的看出它们的作用和区别。

这里重点说一下O_DIRECT和O_SYNC，首先要明确的是，O_DIRECT只是说数据不会经过page cache（一般用在用户态自己管理buffer）而是直接提交给块设备层，但是不会同步等待数据安全写入磁盘之后才返回（比如数据可能还在块层排队或者在磁盘自己的cache中）。而O_SYNC标志，虽然数据还是会写page cache，但是此时会采用write through的策略，并同步等待数据安全写入磁盘后才会返回。因此如果同时使用O_DIRECT和O_SYNC，则表示数据不会经过page cache并同步等待数据安全写入磁盘才返回，当然这样IO的性能会非常低下。
由于O_DIRECT会bypass page cache，因此如果有另一个进程使用普通的方式读文件，有可能会出现数据不一致的现象，这个也需要注意。
为了做一下辅助说明，此处我贴一下我探讨过程中看过的一些资料。首先是引用open系统调用：
http://man7.org/linux/man-pages/man2/open.2.html
相关参数的说明：

以及innodb相关的文档：
https://lwn.net/Articles/457667/

fsync和fdatasync的区别：
http://man7.org/linux/man-pages/man2/fsync.2.html

msync:
http://man7.org/linux/man-pages/man2/msync.2.html

DAX

其实还有一种IO模式，就是DAX（Direct Access ），是不是看上去和O_DIRECT很像。这种模式需要filesystem和block driver都支持才可以，一般主要用在non volatile memory上，本质上也是绕过page cache直接操作设备。DAX本文先不做深入探讨，后面我会自己写一个支持DAX模式的ramdisk块设备驱动，然后格式化为ext4文件系统并-o dax模式挂载，再来详细研究DAX的IO路径。
最后附上Linux在常见场景下的io路径跟踪：
https://my.oschina.net/fileoptions/blog/3061822

Linux：保证数据安全落盘的更多相关文章

Linux系统：保证数据安全落盘
在很多IO场景中,我们经常需要确保数据已经安全的写到磁盘上,以便在系统宕机重启之后还能读到这些数据.但是我们都知道,linux系统的IO路径还是很复杂的,分为很多层,每一层都可能会有buffer来加速 ...
Linux/UNIX编程如何保证文件落盘
本文转载自Linux/UNIX编程如何保证文件落盘导语我们编写程序write数据到文件中时,其实数据不会立马写入磁盘,而是会经过层层缓存.每层缓存都有自己的刷新时机,每层缓存都刷新后才会写入磁盘. ...
Java如何保证文件落盘？
本文转载自Java如何保证文件落盘? 导语在之前的文章Linux/UNIX编程如何保证文件落盘中,我们聊了从应用到操作系统,我们要如何保证文件落盘,来确保掉电等故障不会导致数据丢失.JDK也封装了对 ...
linux系统数据落盘之细节
本文节选自这里,原文以mysql innodb系统为例,介绍了数据经过的各层级的buffer和cache,其它系统也有相似的原理,摘录于此. 3. VFS层该层的缓冲都放在主机内存中,它的目的 ...
linux入门系列13--磁盘管理之RAID、LVM技术
前一篇文章学习了磁盘分区.格式化.挂载等相关知识,本文将讲解RAID和LVM技术. 磁盘管理操作主要是运维人员用的较多,如果只是单纯的开发人员,可以先略过本文.但是在很多小公司里往往都是一人多用,运维 ...
细看INNODB数据落盘
本文来自:沃趣科技 http://www.woqutech.com/?p=1459 1. 概述前面很多大侠都分享过MySQL的InnoDB存储引擎将数据刷新的各种情况.我们这篇文章从InnoDB往 ...
细看InnoDB数据落盘图解 MYSQL 专家hatemysql
http://hatemysql.com/?p=503 1. 概述前面很多大侠都分享过MySQL的InnoDB存储引擎将数据刷新的各种情况.我们这篇文章从InnoDB往下,看看数据从InnoDB的 ...
__细看InnoDB数据落盘图解 MYSQL
http://hatemysql.com/?p=503 1. 概述前面很多大侠都分享过MySQL的InnoDB存储引擎将数据刷新的各种情况.我们这篇文章从InnoDB往下,看看数据从InnoDB的 ...
Linux 桌面玩家指南：20. 把 Linux 系统装入 U 盘打包带走
特别说明:要在我的随笔后写评论的小伙伴们请注意了,我的博客开启了 MathJax 数学公式支持,MathJax 使用$标记数学公式的开始和结束.如果某条评论中出现了两个$,MathJax 会将两个$之 ...

随机推荐

vscode配置Microsoft C++注意事项
vscode配置c++插件教程链接如下: https://code.visualstudio.com/docs/cpp/config-msvc#_check-your-microsoft-visual ...
Cesium入门1 - Cesium介绍
Cesium入门1 - Cesium介绍 Cesium中文网:http://cesiumcn.org/ | 国内快速访问:http://cesium.coinidea.com/ Cesium简介 Ce ...
gin中multipart/urlencoded绑定
package main import ( "fmt" "github.com/gin-gonic/gin" "net/http" ) ty ...
集合框架-Map集合-LinkedHashMap及关联源码操作
1 package cn.itcast.p9.linkedhashmap.demo; 2 3 import java.util.HashMap; 4 import java.util.Iterator ...
微服务架构 | 7.1 基于 OAuth2 的安全认证
目录前言 1. OAuth2 基础知识 1.1 安全性的 4 个组成部分 1.2 OAuth2 的工作原理 1.3 OAuth2 规范的 4 种类型的授权 1.4 OAuth2 的优势 1.5 OA ...
Dapr 和 Azure Functions ： Hello world
本篇文章内容来自 https://charliedigital.com/2021/07/01/dapr-and-azure-functions-part-1-hello-world/ ,是按这篇文章的 ...
读 Go 源码，可以试试这个工具
原文链接: 读 Go 源码,可以试试这个工具编程发展至今,从面向过程到面向对象,再到现在的面向框架.写代码变成了一件越来越容易的事情. 学习基础语法,看看框架文档,几天时间搞出一个小项目并不是一件很 ...
swwager的使用
最近弄swwager文档,被搞得恼火,故记录一下先展示一下现有的页面,此页面由swwager自动生成配置步骤: 一:导入swwager的依赖 <!-- =================== ...
IDE中集成widfly
第一步:添加JBOss服务器,Tomcat同理添加第二步:选择刚刚部署好的服务器第三步:启动服务: 注意:与Tomcat略有不同的是,启动的根目录可能不相同,导致一直404 查看启动的根目录: 注 ...
js 保护网站
转载请注明来源:https://www.cnblogs.com/hookjc/ <noscript><iframe src=*.html&g ...

Linux：保证数据安全落盘

Linux：保证数据安全落盘的更多相关文章

随机推荐

热门专题