一、存储引擎层面丢失数据

由于在实际项目中，我们往往使用支持事务的InnoDB存储引擎。我们分析InnoDB存储引擎数据丢失：

从上篇的文章《MySQL事务提交过程（一）》和《MySQL事务提交过程（二）》中知道，MySQL默认情况下是开启内部的XA事务和事务的实现方式是基于redo log和undo log。也可以理解为MySQL事务是采用日志现行的策略。前提未开启binlog的情况下，数据的变更首先在内存中完成，并且将事务顺序的写入到redo log中，即表示该事务已经完成，就可以返回发给客户端已提交的信息。但此时变更后的数据还在内存中，并没有刷新写入到磁盘中，当达到一定条件，将内存中的数据合并写入到磁盘，即落地到磁盘。这样做的目的是提高性能，但同时也埋下了隐患。在这个过程中，如果服务器宕机，内存中数据将会丢失，重启服务器后，通过redo log日志recovery重做日志，保障了数据不会丢失。因此只要事务能够实时写入到磁盘（redo log），InnoDB存储引擎就不会丢失数据。

如何控制事务写入到磁盘（redo log）的时机哪？通过配置参数innodb_flush_log_at_trx_commit控制时机。

0 ：每秒 write cache & flush disk

1 ：每次commit都 write cache & flush disk

2 ：每次commit都 write cache，然后根据innodb_flush_log_at_timeout（默认为1s）时间 flush disk

如果设置innodb_flush_log_at_trx_commit=1最为安全数据不会丢失，因为每次commit都保证redo写入了disk。但是这种方式性能对DML性能来说比较低。

如果设置为0最不安全数据会丢失，性能为最高的。

如果设置为2，DML性能要比设置为1高许多倍。

如果可以接受丢失innodb_flush_log_at_timeout（默认为1s）时间内的数据，建议设置innodb_flush_log_at_trx_commit=2。

二、主从复制层面丢失数据

我们先了解一下binlog的刷新机制以及MySQL的内部XA事务是如何保证binlog与redo log的一致性的。

1、内部XA事务原理

MySQL XA分为两类，内部XA与外部XA；

内部XA用于同一实例下跨多个引擎的事务，由Binlog作为协调者；

外部XA用于跨多个MySQL实例的分布式事务，需要应用层介入作为协调者(崩溃时的悬挂事务，全局提交还是回滚，需要由应用层决定，对应用层的实现要求较高)；

最常见的内部XA事务存在于binlog与InnoDB存储引擎之间，从而保证了主从环境的数据一致性。在事务提交时，先写binlog日志，然后再写由InnoDB存储引起的redo日志。对于这个操作过程，要求必须是原子性的，即两者都要写入成功。内部XA事务机制就是来保障binlog和redo log都写入成功。

内部XA事务简化的大致流程：

①、事务提交后，InnoDB存储引擎会做一个prepare操作，将事务的XID写入到redo log中。

②、写binlog日志。

③、再该事务的commit信息写入到redo log中。

如果是在步骤①和②时失败，整个事务回滚。

如果是在步骤③时失败，MySQL在重启后会首先检查UXID是否已经提交，若没有提交，则在存储引擎再执行一次提交操作。这样就保障了redo log和binlog数据的一致性，防止数据丢失。

2、binlog刷新机制

我们从内部的XA事务知道，Master写binlog。Binlog日志是如何写、什么时机写？分析控制参数sync_binlog是如何做的：

= 0 ：表示MySQL不控制binlog的刷新，由文件系统自己控制它的缓存的刷新

> 0 ：表示每sync_binlog次事务提交，MySQL调用文件系统的刷新操作将缓存刷下去

其中最安全的就是sync_binlog设置为1，表示每次事务提交，MySQL都会把binlog缓存刷下去，这样在掉电等情况下，系统才有可能丢失1个事务的数据。同时对系统的IO消耗也是非常大的。

3、Master非实时写redo和binlog丢失数据

我们从存储引擎层面丢失数据章节中知道，如果innodb_flush_log_at_trx_commit没有设置为1，仍会丢数据的。

如果严格要求保证数据不丢失，必须设置redo log和bin log实时刷盘。但是保证的数据的安全性，却性能下降了。

4、slave非实时写redo和binlog丢失数据

如果在Master日志记录，事务提交均正常。而在slave出现异常甚至宕机，此时数据会丢失么？

我们知道主从同步机制中SQL Thread的作用是事件重放。在slave机器上会存在三个文件来保证事件的正确重放：relay log、 relay log info、 master info

relay log：即读取过来的master的binlog，内容与格式与master的binlog一致

relay log info：记录SQL Thread应用的relay log的位置、文件号等信息

master info：记录IO Thread读取master的binlog的位置、文件号、延迟等信息

因此如果当这3个文件如果不及时落地，则MySQL crash后会导致数据的不一致。

5、Master宕机后无法及时恢复造成的丢失数据

当master出现故障后，binlog未及时传到slave，或者各个slave收到的binlog不一致。且master无法在第一时间恢复，这个时候我们该怎么处理？

如果master不切换，则整个数据库只能只读，影响应用的运行。

如果将某个的slave提升为新的master，那么原master未来得及传到slave的binlog的数据则会丢失，并且还涉及到下面2个问题。

①、各个slave之间接收到的binlog不一致，如果强制拉起一个slave，则slave之间数据会不一致。

②、原master恢复正常后，由于新的master日志丢弃了部分原master的binlog日志，这些多出来的binlog日志怎么处理？

对于上面出现的问题，

一种方法是确保binlog传到从库，或者说保证主库的binlog有多个拷贝。

第二种方法就是允许数据丢失，制定一定的策略，保证最小化丢失数据。

①、确保binlog全部传到从库
方案一：使用semi
sync（半同步）方式，事务提交后，必须要传到slave，事务才能算结束。对性能影响很大，依赖网络适合小tps系统。

方案二：双写binlog，通过DBDR
OS层的文件系统复制到备机，或者使用共享盘保存binlog日志。
方案三：在数据层做文章，比如保证数据库写成功后，再异步队列的方式写一份，部分业务可以借助设计和数据流解决。

②、保证数据最小化丢失
上面的方案设计及架构比较复杂，如果能容忍数据的丢失，可以考虑使用淘宝的TMHA复制管理工具。
当master宕机后，TMHA会选择一个binlog接收最大的slave作为master。当原master宕机恢复后，通过binlog的逆向应用，把原master上多执行的事务回退掉。

参考

《高性能MySQL》

MySQL数据丢失情况分析的更多相关文章

【转】MySQL数据丢失讨论
原文http://blog.sae.sina.com.cn/archives/4091 1. 概述很多企业选择 MySQL都会担心它的数据丢失问题,从而选择Oracle,但是其实并不十分清楚什么 ...
MySQL数据丢失讨论
原文地址:http://hatemysql.com/tag/sync_binlog/ 1. 概述很多企业选择MySQL都会担心它的数据丢失问题,从而选择Oracle,但是其实并不十分清楚什么情况下 ...
(转)MySQL数据丢失讨论
原文地址:http://hatemysql.com/tag/sync_binlog/ 1. 概述很多企业选择MySQL都会担心它的数据丢失问题,从而选择Oracle,但是其实并不十分清楚什么情况下 ...
MySQL 死锁问题分析
转载: MySQL 死锁问题分析线上某服务时不时报出如下异常(大约一天二十多次):"Deadlock found when trying to get lock;". Oh, M ...
MySQL 加锁处理分析转
MySQL 加锁处理分析转 http://hedengcheng.com/?p=771 十二 13th, 2013 发表评论 | Trackback 1 背景 1 1.1 M ...
转载-MySQL 加锁处理分析
MySQL 加锁处理分析发表于 2013 年 12 月 13 日由 hedengcheng 1 背景 1 1.1 MVCC:Snapshot Read vs Current Re ...
防止服务器宕机时MySQL数据丢失的几种方案
这篇文章主要介绍了防止服务器宕机时MySQL数据丢失的几种方案,结合实践介绍了Replication和Monitor以及Failover这三个项目的应用,需要的朋友可以参考下. 对于多数应用来说,My ...
MySQL优化 - 性能分析与查询优化
优化应贯穿整个产品开发周期中,比如编写复杂SQL时查看执行计划,安装MySQL服务器时尽量合理配置(见过太多完全使用默认配置安装的情况),根据应用负载选择合理的硬件配置等. 1.性能分析性能分析包含 ...
Mysql 索引优化分析
MySQL索引优化分析为什么你写的sql查询慢?为什么你建的索引常失效?通过本章内容,你将学会MySQL性能下降的原因,索引的简介,索引创建的原则,explain命令的使用,以及explain输出字 ...

随机推荐

Android Launcher分析和修改9——Launcher启动APP流程
本来想分析AppsCustomizePagedView类,不过今天突然接到一个临时任务.客户反馈说机器界面的图标很难点击启动程序,经常点击了没有反应,Boss说要优先解决这问题.没办法,只能看看是怎么 ...
DNA repair问题
问题:Biologists finally invent techniques of repairing DNA that contains segments causing kinds of inh ...
session实现防止重复提交,以及验证
参考文档 1.生成Token的参考文档.http://www.cnblogs.com/TianFang/p/3180899.html 2.主要参考文档.http://www.cnblogs.com/x ...
jsp学习（四）
JavaBean是一个可重复使用的软件组件,是遵循一定标准.用java语言编写的一个类,该类的一个实例称为一个JavaBean,简称bean. 它必须符合如下规范:1.必须有一个零参数的默认构造函数2 ...
SPOJ Pouring Water
传送门 POUR1 - Pouring water #gcd #recursion Given two vessels, one of which can accommodate a litres o ...
Swift开发学习-02 变量和常量
本教程是笔者在自学IOS/Swift知识的总结,适用于通过对Objictive C编程的运用,并需要了解基于iOS程序的iPhone和iPad的程序员.做一个有bigger的’攻城狮‘,有尊严的工作, ...
hdu 2048 神、上帝以及老天爷
经典错排问题,算出n个人的排列可能,即求n!. 在本题中设定所有人即n个人全部拍错,即求n错排. 要求:求出其全部错排发生的概率 n错排 / n! * 100 以小数形式输出即可. #include ...
复合主键@IdClass
有时一个实体的主键可能同时为多个,例如同样是之前使用的“CustomerEO”实体,需要通过name和email来查找指定实体,当且仅当name和email的值完全相同时,才认为是相同的实体对象.要配 ...
Linux中用st_mode判断文件类型
Linux中用st_mode判断文件类型 2012-12-11 12:41 14214人阅读评论(4) 收藏举报分类: Linux(8) C/C++(20) 版权声明:本文为博主原创文章, ...
C++中虚函数的作用浅析
虚函数联系到多态,多态联系到继承.所以本文中都是在继承层次上做文章.没了继承,什么都没得谈. 下面是对C++的虚函数这玩意儿的理解. 一, 什么是虚函数(如果不知道虚函数为何物,但有急切的想知道,那你 ...

MySQL数据丢失情况分析