[READ COMMITTED]

首先设置数据库隔离级别为读已提交（READ COMMITTED）:

set global transaction isolation level READ COMMITTED ;

set session transaction isolation level READ COMMITTED ;

[READ COMMITTED]能解决的问题

我们来看一下为什么[READ COMMITTED]如何解决脏读的问题：

事务1：

START TRANSACTION;

① UPDATE users SET state=1 WHERE id=1;

② SELECT sleep(10);

ROLLBACK;

事务2：

START TRANSACTION;

① SELECT * FROM users WHERE id=1;

COMMIT;

事务1先于事务2执行。

事务1的执行信息：

[SQL 1]START TRANSACTION;

受影响的行: 0

时间: 0.001s

[SQL 2]

UPDATE users SET state=1 WHERE id=1;

受影响的行: 1

时间: 0.001s

[SQL 3]

SELECT sleep(10);

受影响的行: 0

时间: 10.000s

[SQL 4]

ROLLBACK;

受影响的行: 0

时间: 0.051s

事务2的执行信息：

[SQL 1]START TRANSACTION;

受影响的行: 0

时间: 0.001s

[SQL 2]

SELECT * FROM users WHERE id=1;

受影响的行: 0

时间: 0.005s

[SQL 3]

COMMIT;

受影响的行: 0

时间: 0.001s

最终结果：

结论：

读已提交[READ COMMITTED]隔离级别可以解决脏读的问题，但是貌似不是按照二级封锁协议解决的脏读问题。

分析：

因为读已提交[READ COMMITTED]隔离级别对应数据库的二级封锁协议。二级封锁协议在修改数据之前对其加X锁，直到事务结束释放X锁。读数据之前必须加S锁，读完即可释放S锁。因为事务1先执行修改，修改前申请持有X锁，事务结束释放X锁。持锁时间段为[SQL 2]开始前到[SQL 4]结束，持锁时间大约为10.056s。事务2在事务1之后进行读操作，按照二级封锁协议所说，事务2在读数据之前会申请持有S锁。但是事务1持有此数据的X锁，所以事务2必须等待事务1释放X锁，这个过程大约在10秒左右。但是我们通过事务2的执行信息可以看到执行查询的时间为0.005s，远远小于10秒。所以我们可以大胆推断Mysql的InnoDB引擎在[READ COMMITTED]隔离级别下对读操作没有加锁。但是[READ COMMITTED]隔离级别确实解决了脏读的问题，那么Mysql是怎么解决的脏读问题呢？

MVCC（多版本并发控制）

答案是多版本并发控制（MVCC），可以认为是行级锁的一个变种，但是它在很多情况下都避免了加锁操作，因此开销更低。实现了非堵塞的读操作，写操作也只需要锁定必要的行。

如果我们理解了MVCC的工作机制，也就可以理解[READ COMMITTED]隔离级别是如何解决脏读问题的。

MVCC具体是如下操作的：

SELECT

InnoDB会根据以下两个条件检查记录：

①InnoDB只会查找版本早于当前事务版本的数据行（也就是，行的版本号小于或是等于事务的系统版本号），这样可以确保数据读取的行，要么是在事务开始前已经存在的，要么是事务自身插入或修改过的。

②行的删除版本号要么未定义，要么大于当前事务版本号。这可以确保事务读取到的行，在事务开始之前未被删除。

只有符合上述两个条件的记录，才能返回作为查询结果。

INSERT

InnoDB为新插入的每一行保存当前系统版本号作为行版本号。

DELETE

InnoDB为删除的每一行保存当前系统版本号作为行删除标识。

UPDATE

InnoDB为新插入的每一行保存当前系统版本号作为行版本号，同时保存当前系统版本号到原来的行作为行删除标识。

Innodb为每行记录都实现了三个隐藏字段：

6字节的事务ID（DB_TRX_ID）

7字节的回滚指针（DB_ROLL_PTR）

隐藏的ID 6字节的事物ID用来标识该行所述的事务

事务1会执行如下操作：

①用排他锁锁定该行

②记录redo log

③把该行修改前的值Copy到undo log，即上图中下面的行

④修改当前行的值，填写事务编号，使回滚指针指向undo log中的修改前的行

如果事务1最后执行COMMIT操作，则什么操作都不用做。如果执行ROLLBACK操作，则需要通过回滚指针从undo log中还原修改前的数据。

read view 判断当前版本数据项是否可见

在InnoDB中，创建一个新事务的时候，InnoDB会将当前系统中的活跃事务列表（trx_sys->trx_list）创建一个副本（read view），副本中保存的是系统当前不应该被本事务看到的其他事务id列表。当用户在这个事务中要读取该行记录的时候，InnoDB会将该行当前的版本号与该read view进行比较。

具体的算法如下:

设该行的当前事务id为trx_id，read view中最早的事务id为trx_id_min, 最迟的事务id为trx_id_max。

如果trx_id< trx_id_min的话，那么表明该行记录所在的事务已经在本次新事务创建之前就提交了，所以该行记录的当前值是可见的。
如果trx_id>trx_id_max的话，那么表明该行记录所在的事务在本次新事务创建之后才开启，所以该行记录的当前值不可见。
如果trx_id_min <= trx_id <= trx_id_max, 那么表明该行记录所在事务在本次新事务创建的时候处于活动状态，从trx_id_min到trx_id_max进行遍历，如果trx_id等于他们之中的某个事务id的话，那么不可见。

从该行记录的DB_ROLL_PTR指针所指向的回滚段中取出最新的undo-log的版本号的数据，将该可见行的值返回。

需要注意的是，新建事务(当前事务)与正在内存中commit 的事务不在活跃事务链表中。

对应源代码如下：

函数：read_view_sees_trx_id。

read_view中保存了当前全局的事务的范围：

【low_limit_id， up_limit_id】

1. 当行记录的事务ID小于当前系统的最小活动id，就是可见的。

    　　if (trx_id < view->up_limit_id) {

    　　　　return(TRUE);

    　　}

2. 当行记录的事务ID大于当前系统的最大活动id（也就是尚未分配的下一个事务的id），就是不可见的。

    　　if (trx_id >= view->low_limit_id) {

    　　　　return(FALSE);

    　　}

3. 当行记录的事务ID在活动范围之中时，判断是否在活动链表中，如果在就不可见，如果不在就是可见的。

    　　for (i = 0; i < n_ids; i++) {

    　　　　trx_id_t view_trx_id

    　　　　　　= read_view_get_nth_trx_id(view, n_ids - i - 1);

    　　　　if (trx_id <= view_trx_id) {

    　　　　return(trx_id != view_trx_id);

    　　　　}

    　　}

事务2会执行如下操作：

理想状态下，事务1的事务id=1,事务2的事务id=2。因为事务2执行时查询时，事务1正处于等待状态。所以read view为{1}，事务2读取的数据行 trx_id=1,read view中最早的事务id为trx_id_min=1, 最迟的事务id为trx_id_max=1。因为trx_id_min <= trx_id <= trx_id_max，并且trx_id_min = trx_id = trx_id_max，说明该行记录所在事务在本次新事务创建的时候处于活动状态，不可见。所以从该行记录的DB_ROLL_PTR指针所指向的回滚段中取出最新的undo-log的版本号的数据，将该可见行的值返回。所以不会出现脏读的现象。

[READ COMMITTED]不能解决的问题

[READ COMMITTED]隔离级别解决不了不可重复读的问题，一个事务中两次读取可能会出现不同的结果。

我们来模拟一下：

事务1：

START TRANSACTION;

① SELECT sleep(5);

② UPDATE users SET state=1 WHERE id=1;

COMMIT;

事务2：

START TRANSACTION;

① SELECT * FROM users WHERE id=1;

② SELECT sleep(10);

③ SELECT * FROM users WHERE id=1;

COMMIT;

事务1先于事务2执行。

执行结果：

结论：

读已提交[READ COMMITTED]隔离级别不能解决不可重复读的问题，但是如果按照上面所说，Mysql的InnoDB引擎是通过read view来判断当前版本数据项是否可见的。那么读已提交[READ COMMITTED]隔离级别下应该也不会出现不可重复读的问题，但是现实并不是。

分析：

读已提交[READ COMMITTED]隔离级别下出现不可重复读是由于read view的生成机制造成的。在[READ COMMITTED]级别下，只要当前语句执行前已经提交的数据都是可见的。在每次语句执行的过程中，都关闭read view, 重新创建当前的一份read view。这样就可以根据当前的全局事务链表创建read view的事务区间。

那么在我们模拟的事务中，事务1的事务id trx_id1=1,事务2的事务id trx_id2=2。假设事务2第一次读取数据前的此行数据的事务id=0。事务2中语句①执行前生成的read view为{1}，trx_id_min=1，trx_id_max=1。因为trx_id(0)< trx_id_max(1)，此行数据对本次事务可见，将该可见行的值state=0返回。语句①执行后等待10秒，第5秒时事务1对数据加X锁进行修改操作0->1，然后提交事务释放锁。语句②执行前生成的read view为{null},说明当前系统中的不存在其他的活跃事务，也就不存在不应该被本事务看到的其他事务，因此该行记录的当前值state=1可见。就出现两次读取数据不一致的问题，也就是不可重复读。

不可重复读的问题在Mysql默认的隔离级别[REPEATABLE READ]中得到了解决。至于是如何解决的，先卖个关子。可以给个小提示，也是和read view的生成机制有关。预知后事如何，请看下篇博客。

本文为博主学习感悟总结，水平有限，如果不当，欢迎指正。

如果您认为还不错，不妨点击一下下方的[【推荐】](javascript:void(0)

【眼见为实】自己动手实践理解READ COMMITTED && MVCC的更多相关文章

【眼见为实】自己动手实践理解数据库READ COMMITTED && MVCC
[READ COMMITTED] 首先设置数据库隔离级别为读已提交(READ COMMITTED): set global transaction isolation level READ COMMI ...
【眼见为实】自己动手实践理解REPEATABLE READ && Next-Key Lock
首先设置数据库隔离级别为可重复读(REPEATABLE READ): set global transaction isolation level REPEATABLE READ ; set sess ...
【眼见为实】自己动手实践理解数据库REPEATABLE READ && Next-Key Lock
[REPEATABLE READ] 首先设置数据库隔离级别为可重复读(REPEATABLE READ): set global transaction isolation level REPEATAB ...
【眼见为实】自己动手实践理解数据库READ UNCOMMITED && SERIALIZABLE
目录准备工作 ①准备测试表和测试数据 ②关闭数据库事务自动提交 ③设置InnoDB存储引擎隔离级别 [READ UNCOMMITTED] [READ UNCOMMITTED]能解决的问题 [READ ...
【原创 Hadoop&Spark 动手实践 8】Spark 应用经验、调优与动手实践
[原创 Hadoop&Spark 动手实践 7]Spark 应用经验.调优与动手实践目标: 1. 了解Spark 应用经验与调优的理论与方法,如果遇到Spark调优的事情,有理论思考框架. ...
【原创 Hadoop&Spark 动手实践 9】Spark SQL 程序设计基础与动手实践（上）
[原创 Hadoop&Spark 动手实践 9]SparkSQL程序设计基础与动手实践(上) 目标: 1. 理解Spark SQL最基础的原理 2. 可以使用Spark SQL完成一些简单的数 ...
【原创 Hadoop&Spark 动手实践 10】Spark SQL 程序设计基础与动手实践（下）
[原创 Hadoop&Spark 动手实践 10]Spark SQL 程序设计基础与动手实践(下) 目标: 1. 深入理解Spark SQL 程序设计的原理 2. 通过简单的命令来验证Spar ...
【原创 Hadoop&Spark 动手实践 6】Spark 编程实例与案例演示
[原创 Hadoop&Spark 动手实践 6]Spark 编程实例与案例演示 Spark 编程实例和简易电影分析系统的编写目标: 1. 掌握理论:了解Spark编程的理论基础 2. 搭建 ...
【原创 Hadoop&Spark 动手实践 7】Spark 计算引擎剖析与动手实践
[原创 Hadoop&Spark 动手实践 7]Spark计算引擎剖析与动手实践目标: 1. 理解Spark计算引擎的理论知识 2. 动手实践更深入的理解Spark计算引擎的细节 3. 通过 ...

随机推荐

ORACLE关于段的HEADER_BLOCK的一点浅析
在学习段(segment).区间(extent)时,对段的HEADER_BLOCK有一些疑问,本文记录一下探究的实验过程以及相关总结,,如有不对的地方,敬请指出.以SCOTT.EMP表为例(下面测试环 ...
Vxworks驱动程序的结构
驱动程序的结构包括三个部分:初始化部分,函数功能部分和中断服务程序ISR.初始化部分初始化硬件,分配设备所需的资源,完成所有与系统相关的设置.如果是字符设备,首先调用iosDrvlnstall()来安 ...
freemarker自定义标签报错（八）
1.错误描述 freemarker.core.ParseException: Token manager error: freemarker.core.TokenMgrError: Unknown d ...
（二十九）java条件控制语句培训笔记
java结构控制语句示例:if,if else,switch case 定义三个变量: :在这个例子中,if并列,则每一次都会进行判断,条件为true则输出里边的内容 ,因此,这里会输出one和fou ...
芝麻HTTP：redis-py的安装
对于Redis来说,我们要使用redis-py库来与其交互,这里就来介绍一下它的安装方法. 1. 相关链接 GitHub:https://github.com/andymccurdy/redis-py ...
SpringMVC工作流程描述
向服务器发送HTTP请求,请求被前端控制器 DispatcherServlet 捕获. DispatcherServlet 根据 <servlet-name>-servlet.xml 中的 ...
span是没有value标签的，要向获得标签内部的值改怎么办。
1,js实现 var div = document.getElementById('divId');var spans = div.getElementsByTagName('span');var s ...
C语言字符串前加L的意义如：L“A”
转自:http://c.biancheng.net/cpp/html/1069.html Unicode或者宽字符都没有改变char数据型态在C中的含义.char继续表示1个字节的储存空间,sizeo ...
【CJOJ1167】【洛谷1894】[USACO4.2]完美的牛栏
题面 Description 农夫约翰上个星期刚刚建好了他的新牛棚,他使用了最新的挤奶技术.不幸的是,由于工程问题,每个牛栏都不一样.第一个星期,农夫约翰随便地让奶牛们进入牛栏,但是问题很快地显露出来 ...
一些比较隐秘的OJ的网址
( 1 )COGS:cogs.pro:8080 ( 2 )AGC:agc012.contest.atcoder.jp ( 3 )CS Acaemy:csacademy.com ( 4 )JoyOI:w ...

【眼见为实】自己动手实践理解READ COMMITTED && MVCC