一文搞懂MySQL事务的隔离性如何实现|MVCC
关注公众号【程序员白泽】,带你走进一个不一样的程序员/学生党
前言
MySQL有ACID四大特性,本文着重讲解MySQL不同事务之间的隔离性的概念,以及MySQL如何实现隔离性。下面先罗列一下MySQL的四种事务隔离级别,以及不同隔离级别可能会存在的问题。事务隔离级别越高,多个事务在并发访问数据库时互相产生数据干扰的可能性越低,但是并发访问的性能就越差。(相当于牺牲了一定的性能去保证数据的安全性)
下面这张表,展示了MySQL的四大隔离级别和伴随着的一些问题,下面详细介绍。
事务隔离级别
读未提交:多个事务同时修改一条记录,A事务对其的改动在A事务还没提交时,在B事务中就可以看到A事务对其的改动。
读已提交:多个事务同时修改一条记录,A事务对其的改动在A事务提交之后,在B事务中可以看到A事务对其的改动。
可重复读:多个事务同时修改一条记录,这条记录在A事务执行期间是不变的(别的事务对这条记录的修改不被A事务感知)。
串行化:多个事务同时访问一条记录(CRUD),读加读锁,写加写锁,完全退化成了串行的访问,自然不会收到任何其他事务的干扰,性能最低。
不同级别伴随的问题
脏读:A事务在提交前对一个字段的改动会被B事务感知,那么事务之间就很容易产生干扰,假如A对一个字段改动之后被B感知,但是A又回滚了事务,则对该字段的改动依旧保留在B的查询结果中,那么这样的数据就是脏数据(处于处理中间过程的数据)。
不可重复读:A事务对于一条记录的读取结果,在B事务对其修改并提交之后,A再次读取同一条记录会得到不同的结果。
幻读:侧重于A事务的同一个范围查询命令,前后两次得到不同的记录数量,原因是B事务可能对其进行了插入。
小结一下
通过阅读上面给出的内容,可以得到结论:
- 读未提交隔离级别并没有对行数据的可见性做任何限制,所有事务之间的改动都是互相可见的,所以存在很多问题,不推荐使用;
- 串行化隔离级别因为通过锁机制对记录的访问进行限制,所以安全性最高,但并发访问退化成串行访问,性能较低;
因此本文将侧重于探究MySQL如何实现读已提交
和可重复读
两种隔离级别(也就是你听闻的MVCC多版本并发控制的实现),通过后面的学习你将理解读已提交
隔离级别如何解决脏读
,可重复读
隔离级别如何更进一步解决不可重复读
。
接下来我将向你介绍undo 版本链
机制以及read view
快照读机制,这两个机制相互配合是实现MVCC的核心,而读已提交
和可重复读
隔离级别的实现都是建立在这两个核心机制之上。
undo 版本链
undo 版本链就是指undo log的存储在逻辑上的表现形式,它被用于事务当中的回滚操作以及实现MVCC,这里介绍一下undo log之所以能实现回滚记录的原理。
对于每一行记录,会有两个隐藏字段:row_trx_id
和roll_pointer
,row_trx_id
表示更新(改动)本条记录的全局事务id (每个事务创建都会分配id,全局递增,因此事务id区别对某条记录的修改是由哪个事务作出的) ,roll_pointer
是回滚指针,指向当前记录的前一个undo log版本
,如果是第一个版本则roll_pointer
指向nil,这样如果有多个事务对同一条记录进行了多次改动,则会在undo log
中以链的形式存储改动过程。
假如有两个事务AB,数据表中有一行id为1的记录,其字段a初始值为0,事务A对id=1的行的a修改为1,事务B对id=1的行的a字段修改为2,则undo log版本链
记录如下:
在上图中,最下方的undo log中记录了当前行的最新版本,而该条记录之前的版本则以版本链的形式可追溯,这也是事务回滚所做的事。那undo log版本链和事务的隔离性有什么关系呢?那就要引入另一个核心机制:read view。
read view
read view表示快照读,这个快照读会记录四个关键的属性:
create_trx_id
: 当前事务的idm_idx
: 当前正在活跃的所有事务id(id数组),没有提交的事务的idmin_trx_id
: 当前系统中活跃的事务的id最小值max_trx_id
: 当前系统中已经创建过的最新事务(id最大)的id+1的值
当一个事务读取某条记录时会追溯undo log版本链,找到第一个可以访问的版本,而该记录的某一个版本是否能被这个事务读取到遵循如下规则:(这个规则永远成立,这个需要好好理解,对后面讲解可重复读和读已提交两个级别的实现密切相关)
如果当前记录行的row_trx_id小于min_trx_id,表示该版本的记录在当前事务开启之前创建,因此可以访问到
如果当前记录行的row_trx_id大于等于max_trx_id,表示该版本的记录创建晚于当前活跃的事务,因此不能访问到
如果当前记录行的row_trx_id大于等于min_trx_id且小于max_trx_id,则要分两种情况:
- 当前记录行的row_trx_id在m_idx数组中,则当前事务无法访问到这个版本的记录 (除非这个版本的row_trx_id等于当前事务本身的trx_id,本事务当然能访问自己修改的记录) ,在m_idx数组中又不是当前事务自己创建的undo版本,表示是并发访问的其他事务对这条记录的修改的结果,则不能访问到。
- 当前记录行的row_trx_id不在m_idx数组中,则表示这个版本是当前事务开启之前,其他事务已经提交了的undo版本,当前事务可访问到。
配合使用read view
和undo log版本链
就能实现事务之间并发访问
相同记录时,可以根据事务id不同,获取同一行的不同undo log版本(多版本并发控制)。下面通过模拟并发访问的两个事务操作,介绍MVCC的实现(具体来说就是可重复读和读已提交两个隔离级别的实现)
可重复读
下面模拟两个并发访问同一条记录的事务AB的行为,假设这条记录初始时id=1,a=0,该记录两个隐藏字段row_trx_id = 100,roll_pointer = nil
注意:在可重复读隔离级别下,当事务sql执行的时候,会生成一个read view快照,且在本事务周期内一直使用这个read view,下面给出了并发访问同一条记录的两个事务AB的具体执行过程,并解释可重复读
是如何实现的(解决了脏读
和不可重复读
)。
事务A的read view:
create_trx_id
= 101| m_idx
= [101, 102]|min_trx_id
= 101|max_trx_id
= 103
事务B的read view:
create_trx_id
= 102| m_idx
= [101, 102]|min_trx_id
= 101|max_trx_id
= 103
(ps. 这里因为AB事务是并发执行,因此两个事务创建的read view的max_trx_id = 103)
这里要注意的是,每次对一条记录发生修改,就会记录一个undo log的版本,则在A事务中第二次查询id=1的记录的a的值的时候,B事务对该记录的修改已经添加到版本链上了,此时这个undo log
的trx_id = 102
,在A事务的read view
的m_idx数组
中且不等于A事务的trx_id = 101
,因此无法访问到,需要在向前回溯,这里找到trx_id = 100
的记录版本(小于A事务read view
的min_trx_id
属性,因此可以访问到),故A事务第二次查询依旧得到a = 0,而不是B事务修改的a = 1。
你可能有疑问,在A事务第二次查询的时候,B事务已经完成提交了,那么A事务的read view的m_idx数组应该移除102才对啊,它存的不是当前活跃的事务的id吗?·
注意:在可重复读隔离级别下,当事务sql执行的时候,会生成一个read view快照,且在本事务周期内一直使用这个read view,虽然102确实应该从A事务的read view中移除,但是因为read view在可重复读隔离级别下只会在第一条SQL执行时创建一次,并始终保持不变直到事务结束。
那么也就明白了,在可重复读隔离级别下,因为read view只在第一条SQL执行时创建,因此并发访问的其他事务提交前改动的脏数据、以及并发访问的其他事务提交的改动数据都对当前事务是透明的(尽管确实是记录在了undo log版本链中) ,这就解决了脏读和不可重复读(即使其他事务提交的修改,对A事务来说前后查询结果相同)的问题!
读已提交
还是借助上面事务处理的例子,所有的事务处理流程不变,只是将隔离级别调整为读已提交,读已提交依旧遵守read view和undo log版本链机制,它和可重复读级别的区别在于,每次执行sql,都会创建一个read view,获取最新的事务快照。 而因为这个区别,读已提交产生了不可重复读的问题,下面来分析一下原因:
事务A第一次查询创建的read view:
create_trx_id
= 101| m_idx
= [101, 102]|min_trx_id
= 101|max_trx_id
= 103
事务B的read view:
create_trx_id
= 102| m_idx
= [101, 102]|min_trx_id
= 101|max_trx_id
= 103
事务A第二次查询创建的read view:
create_trx_id
= 101| m_idx
= [101]|min_trx_id
= 101|max_trx_id
= 103
(ps. 这里因为AB事务是并发执行,因此两个事务创建的read view的max_trx_id = 103)
这里重点观察A事务的第二次查询,之前你可能就意识到了,在事务B完成提交后,当前系统中活跃的事务id应该移除102,但是因为在可重复读隔离级别下,A事务的read view
只会在第一个SQL执行时创建,而在读已提交隔离级别下,每次执行SQL都会创建最新的read view,且此时 m_idx
数组中移除了102,那么事务A在追溯undo log版本链的时候,最新版本记录的trx_id = 102
,102不在A事务的m_idx数组中,且101 = min_trx_id <= 102 < max_trx_id = 103
,因此可以访问到B事务的提交结果。
那么对A事务来说,在事务过程中读取同一条记录第一次得到a=0,第二次得到a=1,所以出现了不可重复读的问题(这里B不提交的话A如果就进行了第二次查询,则102不会从A事务的read view移除,则A事务依旧访问不到B事务未提交的修改,因此脏读还是可以避免的!)
结束语
在我的理解中,MVCC多版本并发控制的实现可以理解成读已提交、可重复读两种隔离级别的实现,通过控制read view的创建时机(其访问机制是不变的),配合undo log版本链可以实现事务之间对同一条记录的并发访问,并获得不同的结果。
关注公众号【程序员白泽】,带你走进一个不一样的程序员/学生党,公众号回复【简历】可以获得我正在使用的简历模板,平时也会同步更新文章。希望大家都能收获心仪的offer~
一文搞懂MySQL事务的隔离性如何实现|MVCC的更多相关文章
- 一文搞懂mysql索引底层逻辑,干货满满!
一.什么是索引 在mysql中,索引是一种特殊的数据库结构,由数据表中的一列或多列组合而成,可以用来快速查询数据表中有某一特定值的记录.通过索引,查询数据时不用读完记录的所有信息,而只是查询索引列即可 ...
- 一文搞懂MySQL体系架构!!
写在前面 很多小伙伴工作很长时间了,对于MySQL的掌握程度却仅仅停留在表面的CRUD,对于MySQL深层次的原理和技术知识了解的少之又少,随着工作年限的不断增长,职场竞争力却是不断降低的.很多时候, ...
- 一文搞懂│mysql 中的备份恢复、分区分表、主从复制、读写分离
目录 mysql 的备份和恢复 mysql 的分区分表 mysql 的主从复制读写分离 mysql 的备份和恢复 创建备份管理员 创建备份管理员,并授予管理员相应的权限 备份所需权限:select,r ...
- 一文搞懂MySQL前缀索引
引入 通常在开发中我们需要定义字符串类型的字段,例如用户名或者用户邮箱等. 假设我们在维护一个用户登录系统,用户表的定义: create table User( ID bigint unsigned ...
- 一文读懂MySQL的事务隔离级别及MVCC机制
回顾前文: 一文学会MySQL的explain工具 一文读懂MySQL的索引结构及查询优化 (同时再次强调,这几篇关于MySQL的探究都是基于5.7版本,相关总结与结论不一定适用于其他版本) 就软件开 ...
- 一文彻底读懂MySQL事务的四大隔离级别
前言 之前分析一个死锁问题,发现自己对数据库隔离级别理解还不够清楚,所以趁着这几天假期,整理一下MySQL事务的四大隔离级别相关知识,希望对大家有帮助~ 事务 什么是事务? 事务,由一个有限的数据库操 ...
- 一文快速搞懂MySQL InnoDB事务ACID实现原理(转)
这一篇主要讲一下 InnoDB 中的事务到底是如何实现 ACID 的: 原子性(atomicity) 一致性(consistency) 隔离性(isolation) 持久性(durability) 隔 ...
- 搞懂MySQL InnoDB事务ACID实现原理
前言 说到数据库事务,想到的就是要么都做修改,要么都不做.或者是ACID的概念.其实事务的本质就是锁和并发和重做日志的结合体.那么,这一篇主要讲一下InnoDB中的事务到底是如何实现ACID的. 原子 ...
- MySQL事务学习-->隔离级别
MySQL事务学习-->隔离级别 6 事务的隔离级别 设置的目的 在数据库操作中,为了有效保证并发读取数据的正确性,提出的事务隔离级别. 数据库是要被广大客户所共享访问的,那么在数据库操作过程中 ...
随机推荐
- FreeBSD 利用IPFW实现限制局域网使用QQ
QQ服务器分为三类: 1.UDP 8000端口类7个:速度最快,服务器最多.QQ上线会向这7个服务器发送UDP数据包,选择回复速度最快的一个作为连接服务器.这7个服务器名字均以sz-sz7开头,域后缀 ...
- vim编写C/C++程序过程
vim编写C.C++程序过程(以hello world为例): vim hello.c/hello.cpp 或者vi hello.c/hello.cpp创建hello.c/hello.cpp文件并进入 ...
- PLSQL导出Oracle表结构
tools->export tables 是导出表结构还有数据 tools->export user objects是导出表结构 可以用tools->export tables ...
- SpringBoot在线预览PDF文件(引用pdf.js工具)
本项目Demo使用了PDF.js插件实现PDF在线阅读功能PDF.js插件下载地址 实测能用! 1.创建SpringBoot项目,目录结构如下: 2.进行项目配置: pom.xml: <proj ...
- 到底为什么不建议使用SELECT *?
"不要使用SELECT *"几乎已经成为了MySQL使用的一条金科玉律,就连<阿里Java开发手册>也明确表示不得使用*作为查询的字段列表,更是让这条规则拥有了权威的加 ...
- 重磅!Vertica集成Apache Hudi指南
1. 摘要 本文演示了使用外部表集成 Vertica 和 Apache Hudi. 在演示中我们使用 Spark 上的 Apache Hudi 将数据摄取到 S3 中,并使用 Vertica 外部表访 ...
- 使用 JWT 来保护你的 SpringBoot 应用
关键词 写在前面 Spring Boot 创建Spring Boot应用 创建一个Web 应用 使用JWT保护你的Spring Boot应用 添加Spring Security 本文代码 关键词 Sp ...
- 同一套代码部署多个实例来并行完成mysql某项任务,且避免重复执行
我经常会碰到一些耗时较长的任务,譬如更新5千万条表数据中的某个字段,代码中可以通过分页依次读取db,然后更新即可.但是耗时极长,那么能否通过将代码部署多个实例,譬如启动多个docker来并行执行任务, ...
- Shiro集成多个Realm,认证都不通过返回y configured realms. Please ensure that at least one realm can authenticate these tokens.
异常内容:Authentication token of type [class org.apache.shiro.authc.UsernamePasswordToken] could not be ...
- JQuery Validate验证插件自定义验证消息
// 自定义验证的方法,验证通过返回true,否则返回false(会显示错误消息) jQuery.validator.addMethod; // 定义验证的消息 jQuery.validator.fo ...