前言

　　众所周知，MySQL的在RR隔离级别下查询数据，是可以保证数据不受其它事物影响，而在RC隔离级别下只要其它事物commit后，数据都会读到commit之后的数据，那么事物隔离的原理是什么？是通过什么实现的呢？那肯定是通过MVCC机制（Multi-Version Concurrency Control，即多版本并发控制），这是很多人知道的，但是我之前没有好好分析过其实现原理，所以写下此篇博文记录下!

　　注：MySQL的InnoDB引擎之所以能够支持高性能的并发性能，就是由于MySQL的MVCC机制（归功于undo log、Read-View、），但是本篇不对MVCC过多的介绍。

　　参考资料：《MySQL实战45讲》系列，虽然讲解的比较清晰，但是仍然需要理解，比如关于视图数组部分我认为是相比较而言没有解释清楚，所以结合资料与自己见解加以记录！

一、RC与RR隔离级别

我们分别开启RC与RR隔离级别实验说明，首先假设有account账户表，在事务ABC开启前，账户中的余额balance为1，即

select balance from account =1; # 结果为1

1.RR事务隔离级别下查询结果

当在RR事务隔离级别分别开启三个事务，在不同时间段内做如下操作

事务A（显式开启事务，手动commit提交）：查询余额
事务B（显式开启事务，手动commit提交）：对id=1的余额加1
事务C（不显式开启事务，自动提交）：对id=1的余额加1

我们从时间逻辑上分为三个阶段，分析结果

第一阶段：事务A立马开始事务，随后事务B也紧跟着立马开始事务，然后事务C首先更新balance为2成功，当前balance=2；
第二阶段：事务B更新balance的值，此时先读到当前balance最新值为2，随后set balance=balance+1成功，当前balance=3；
第三阶段：事务A查询balance的值，此时的值为1（这里为什么等于1呢，是怎么实现的呢？不应该是当前最新值3吗？这就是本篇博文讨论的重点），最后commit结束事务，紧接着事务B也commit结束事务

最后事务A读取balance的结果是1，理所当然，RR即为可重复读，即一个事务在执行过程中看到的数据，总是跟这个事务启动时看到的数据是一致的，当前事务不管有没有提交，都不会影响数据，我只需要读取基于快照的数据即可，这就是快照读。但是我们要讨论的是如何在MVCC机制下实现？

注：begin/start transaction 命令并不是一个事务的起点，在执行到它们之后的第一个操作InnoDB表的语句，事务才真正启动。如果你想要马上启动一个事务，可以使用start transaction with consistent snapshot 这个命令。

1.RC事务隔离级别下查询结果

同样地，我们在RC隔离下，开启事务ABC，观察事务A最后的balance结果。

最后事务A读取balance的结果是2，理所当然，RC即为读可提交，字面意思就是其他事务只要提交后，当前事务我就能立马读取到最新当前值，这就是当前读。但是我们要讨论的是如何在MVCC机制下实现？

　实际上这是因为实现MVCC时用到的一致性读视图，即consistent read view，用于支持RC（Read Committed，读提交）和RR（Repeatable Read，可重复读）隔离级别的实现。

三、事务隔离在MVCC的实现

在探讨MVCC如何实现事务隔离前，我们需要知道是视图数组、一致性视图等概念，才能帮助更好理解MVCC帮助事务实现了隔离。

1.数据行ROW的多版本

　　InnoDB里面每个事务有一个唯一的事务ID，叫作transaction id。它是在事务开始的时候向InnoDB的事务系统申请的，是按申请顺序严格递增的。

　　而每行数据也都是有多个版本的。每次事务更新数据的时候，都会生成一个新的数据版本，并且把transaction id赋值给这个数据版本的事务ID，记为row trx_id。同时，旧的数据版本要保留，并且在新的数据版本中，能够有信息可以直接拿到它（通过undo_log文件找到）。

　　也就是说，数据表中的一行记录，其实可能有多个版本(row)，每个版本有自己的row trx_id。

　　对某一个数据行ROW某个时刻经过三次更新事务的多版本控制流程，画如下图加深理解。

从图我们可以得到：

ROW有四个版本V1-V4，即经过三次更新balance后，当前最新版本为V4，当前balance已经更新为4，是最新值
InnoDB每次更新事务产生的transaction id都会赋值给row trx_id；
通过undo_log可以从V4撤回到V1,找到V1版本的balance=1，即undo_log回滚版本。

明白了数据行的ROW的多版本原理与实现后，可以帮助我们理解InnoDB是怎么定义并创建快照的！

2.视图数组

　　下述部分出自资料中的原句，特别是红色加深部分可能会比较难以理解，所以需要结合自己理解并画图

InnoDB是这么在事务开启的时候定义快照的，哪些事务的操作我可以忽视，哪么我必须要保存在快照里。可以理解为：一个事务只需要在启动的时候声明说，“以我启动的时刻为准，如果一个数据版本是在我启动之前生成的，就认；如果是我启动以后才生成的，我就不认，我必须要找到它的上一个版本”。

　　在实现上， InnoDB为每个事务构造了一个数组，用来保存这个事务启动瞬间，当前正在“活跃”的所有事务ID。“活跃”指的就是，启动了但还没提交。数组里面事务ID的最小值记为低水位，当前系统里面已经创建过的事务ID的最大值加1记为高水位。这个视图数组和高水位，就组成了当前事务的一致性视图（read-view）。

我对低水位与高水位的理解：

低水位=当前所有启动了但未提交事务集合的ID最小值=当前事务的上一个启动但未提交的事务ID最小值（所有活跃事务ID最小值）

高水位=当前事务的ID（当前ROW版本号/row trx_id）=已经创建过事务ID的最大值+1

举例说明：仍然以上述RR隔离级别下三个ABC事务为例

事务A开始前，系统里面只有一个活跃事务ID是99；
事务A、B、C的版本号分别是100、101、102，且当前系统里只有这四个事务；
三个事务开始前，(id,balance)=(1,1）这一行数据的row trx_id是90。

这样，事务A的视图数组就是[99], 事务B的视图数组是[99,100], 事务C的视图数组是[99,100,101]。即视图数组通用公式为：[{当前事务开启瞬间活跃事务ID集合}]。

而数据版本的可见性规则，就是基于row trx_id和一致性视图对比结果得到的，所以我们还必须再了解下一致性视图

3.一致性视图

通过对视图数组的理解，一致性视图就更加容易了，即：这个视图数组和高水位，就组成了当前事务的一致性视图（read-view）。

仍然以上述RR隔离级别下三个ABC事务为例

事务A开始前，系统里面只有一个活跃事务ID是99, 所以事物A开启瞬间活跃事物集合为[99]；
事务A、B、C的版本号分别是100、101、102，且当前系统里只有这四个事务，所以事物A、B、C高水位分别为100、101、102；
三个事务开始前，(id,balance)=(1,1）这一行数据的row trx_id是90。

这样，事务A的一致性视图就是[99,100], 事务B的一致性视图是[99,100,101], 事务C的一致性视图是[99,100,101,102]。即一致性视图通用公式为：[{当前事务开启瞬间活跃事务ID集合}，当前row trx_id]。

分析上述流程图结果：

第一个有效更新版本是事物C，更新balance=2，这个时候的最新版本row trx_id=102，而之前的在事物ABC之前的活跃事物最新版本row trx_id为99，所以此时99已经成为历史版本1；

第二个有效更新版本是事物B，更新balance=3，这个时候最新版本row trx_id=101，而此时row trx_id=102成为历史版本1，而row trx_id=99成为历史版本2；

事物A查询的时候，事物B是没有提交，但生成的(id, balance)=(1, 3)已经成为当前最新版本，事物A读取数据时，一致性视图为[99, 100]，而读数据都是从当前版本切的然后对比row trx_id，所以会有以下流程：

找到(1,3)的时候，判断出row trx_id=101，比高水位大，处于红色区域，不可见；
接着，找到上一个历史版本，一看row trx_id=102，比高水位大，处于红色区域，不可见；
再往前找，终于找到了（1,1)，它的row trx_id=90，比低水位小，处于绿色区域，可见。

最后事物A无论在什么时候查询，看到的数据都是一致性视图[99, 100]生成的快照数据(1, 1)，即row trx_id=90时的数据。这就称之为一致性读。

总结：

对于一个事务视图来说，除了自己的更新总是可见以外，有三种情况：

版本未提交，不可见；
版本已提交，但是是在视图创建后提交的，不可见；
版本已提交，而且是在视图创建前提交的，可见。

现在，我们用这个规则来判断图中的查询结果，事务A的查询语句的视图数组是在事务A启动的

时候生成的，这时候：

(1,3)还没提交，属于情况1，不可见；
(1,2)虽然提交了，但是是在视图数组创建之后提交的，属于情况2，不可见；
(1,1)是在视图数组创建之前提交的，可见。

4.当前读与快照读

（1）当前读与快照读规则

　　当然按照这个一致性读的逻辑，事物B在事物C有效更新balance=2之后，但是事物B的视图数组是在事物C生成的，所以理论上来说不应该是事物B看到的是(id, balance)=(1, 1)这个数据（快照/历史版本）吗？而看不到当前版本(1, 2)数据。为什么事物B在更新balance之后直接数据就成为(1, 3)了呢？

　　如果事物B在update之前select一次数据，看到的值确实是balance=1，但是update是不能在历史版本上操作的，否则事物C的更新就会丢失，所以update操作都是在先读取当前版本，然后再更新。

　　也就说有这么一条规则：更新数据都是先读后更新，而这个读是读当前最新值，称之为“当前读（current read），而只查询不读的话就会读取当前快照，称之为“快照读”。所以在事物B更新balance之前，先查询到最新的版本(1, 2)然后再更新为(1, 3)。而事物A查询的快照数据为(1, 1)，而不是最新版本(1, 3)。

（2）当前读与快照读解释

　　当前读：像select lock in share mode(共享锁), select for update ; update, insert ,delete(排他锁)这些操作都是一种当前读。就是它读取的是记录的最新版本，读取时还要保证其他并发事务不能修改当前记录，会对读取的记录进行加锁。

　　快照读：像不加锁的select操作就是快照读，即不加锁的非阻塞读；快照读的前提是隔离级别不是串行级别，串行级别下的快照读会退化成当前读。是基于多版本控制的，那么快照读可能读到的并不一定是数据的最新版本，而有可能是之前的历史版本（快照数据）。

（3）RC读可提交下的视图规则

读提交的逻辑和可重复读的逻辑类似，它们最主要的区别是：

在可重复读隔离级别下，只需要在事务开始的时候创建一致性视图，之后事务里的其他查询，都共用这个一致性视图；
在读提交隔离级别下，每一个语句执行前都会重新算出一个新的视图，此时start transaction with consistent snapshot就等同于普通的start transaction/begin

所以在RC隔离级别下，事物A与事物B查询到的数据分别如下：

事物C立马更新balance=2，然后自动提交，生成最新版本(1, 2)，此时重新计算出视图数据(1, 2);
事物B查到此时的最新版本为(1, 2)，之后再更新为版本(1, 3)为当前最新版本，查询此时的事物B select到的balance=3（事物B更新balance=3之后立马算出一个新的视图，select就是根据此视图得到的数据），而不是1。
而此时事物B还未提交，对于事物A来说是看不见的，所以事物A此时读取到的事物C提交的最新版本(1, 2)。

MySQL是如何实现事物隔离？的更多相关文章

07: mysql锁和事物隔离
MySQL其他篇目录: 1.1 MySQL中的事物 1.2 mysql中锁 1.1 MySQL中的事物返回顶部 1.InnoDB事务原理 1. 事务(Transaction)是数据库区别于文件系统的 ...
数据库操作事物的四大特性以及MySQL数据库的四种隔离级别
1 .事物操作数据库的四大特性(ACID) 1.原子性 (Atomicity) 原子性:就是事物的所包含的所有操作,要么全部成功,要么全部失败回滚. 2.一致性 (Consistency) 一致性:简 ...
mysql事物隔离级别
mysql实现了四种隔离级别 Read Uncommitted(未提交读) 在该隔离级别,所有事务都可以看到其他未提交事务的执行结果.本隔离级别很少用于实际应用,因为它的性能也不比其他级别好多少.读取 ...
MySQL数据库的事物隔离级别
一. 查看数据库的事物隔离级别 mysql> show variables like '%isolation'; +-----------------------+--------------- ...
★ MYSQL隔离级别通俗理解 + mysql、oracle默认事务隔离级别
★ 脏读 : 读取了前一事务未提交的数据 ; 不可重复读 : 读取了前一事务提交的数据: ★ 幻读与不可重复读 common :都是读取了另一条已经提交的事务(这点与脏读不 ...
MySQL数据库引擎、事务隔离级别、锁
MySQL数据库引擎.事务隔离级别.锁数据库引擎InnoDB和MyISAM有什么区别大体区别为: MyISAM类型不支持事务处理等高级处理,而InnoDB类型支持.MyISAM类型的表强调的是性能 ...
Spring事物隔离级别及事物传播行为@Transactional实现
阅读本篇文章前,请先阅读如下文章: 四种事物隔离级别详解先看下@Transactional可以配制那些参数及以其所代表的意义. isolation 枚举org.springframework.tra ...
MVCC原理 4步什么是MVCC、事务ACID、事物隔离级别、Innodb存储引擎是如何实现MVCC的
MVCC是来处理并发的问题,提高并发的访问效率,读不阻塞写.事物A 原子性C 一致性I 隔离性D 持久性高并发的场景下的问题脏读不可重复读幻读事物隔离级别RU读未提交脏读/不可重复读/幻读 .不适用 ...
SQL事物隔离级别
标准SQL定义了4个隔离级别 Read uncommitted 未提交读 Read committed 已提交读 Repeatable read 可重复读 Serializable 可序列化基本语法 ...

随机推荐

HACK TEH BOX - Under Construction（JWT密钥混淆 + SQL注入）
HACK TEH BOX - Under Construction(JWT密钥混淆 + SQL注入) 目录 1. JWT密钥混淆 2. 环境 3. Challenge 4. Walkthrough 1 ...
BadUsb配合Cobalt-Strike免杀上线
BadUsb配合Cobalt-Strike免杀上线前言: 原理简介:Badusb的原理是将恶意代码预置在固件之中,当受害人插入USB时,就会执行恶意代码进行恶意操作.Badusb将恶意代码预存在U盘 ...
hdu1978 简单记忆化搜索
题意: How many ways Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) T ...
安全之路 —— 无DLL文件实现远程进程注入
简介在之前的章节中,笔者曾介绍过有关于远程线程注入的知识,将后门.dll文件注入explorer.exe中实现绕过防火墙反弹后门.但一个.exe文件总要在注入时捎上一个.dll文件着实是怪麻烦的,那 ...
Windows中动态磁盘管理
目录动态磁盘基本磁盘和动态磁盘的转换简单卷跨区卷带区卷镜像卷 RAID-5卷相关文章:硬盘分区形式(MBR.GPT).系统引导.文件系统.Inode和Block 动态磁盘 Windows ...
Linux中常见的150个命令(干货)
目录线上查询及帮助命令文件和目录操作命令查看文件和内容处理命令文件压缩及解压缩命令信息显示命令搜索文件命令进程管理相关命令用户管理命令基础网络操作命令深入网络操作命令有关磁盘与文 ...
WPScan工具的使用(WordPress扫描工具)
WPScan是Kali Linux默认自带的一款漏洞扫描工具,它采用Ruby编写,能够扫描WordPress网站中的多种安全漏洞,其中包括WordPress本身的漏洞.插件漏洞和主题漏洞.最新版本WP ...
用户模式下的线程同步的分析（Windows核心编程）
线程同步同一进程或者同一线程可以生成许多不同的子线程来完成规定的任务,但是多个线程同时运行的情况下可能需要对某个资源进行读写访问,比如以下这个情况:创建两个线程对同一资源进行访问,最后打印出这个资源 ...
9.PHP文件处理
PHP文件系统 (当成是扩展C++来看就行了,几乎一样): 读取整个文件readfile() .file(). file_get_contents() <?php readfile('fi ...
Windows核心编程第十一章线程池的使用
第11章线程池的使用第8章讲述了如何使用让线程保持用户方式的机制来实现线程同步的方法.用户方式的同步机制的出色之处在于它的同步速度很快.如果关心线程的运行速度,那么应该了解一下用户方式的同步机制是 ...

MySQL是如何实现事物隔离？

前言