理解 MVCC
MongoDB、MySQL、Oracle、PostgreSQL 等事务型数据库都有 mvcc 的概念。
MVCC: 即多版本并发控制,主要是为了提高数据库的读写性能,让数据库在读写的时候不用去加锁。mvcc 主要是处理读请求,这个读指的是快照读,而不是当前读,快照读就是普通的 select 查询。而当前读,其实就是一种悲观锁,要靠加锁实现,比如我们执行 update 或 delete 的时候,你需要先把数据读出来,然后再进行修改操作。比如 select xx for update, 这种排他锁,还有 select xxx lock in share mode 共享锁,这种加锁的方式就是当前读,是需要用锁来保证数据的强一致性。快照读是用 mvcc 实现的,他的目的是读写数据行的时候,不用去竞争锁,提升数据库的并发性能。
数据库的事务有 acid 的特性,原子性用 undo log 实现,持久性是 redo log,而隔离性则是通过加锁和 mvcc 实现。 mysql 事务有 4 中隔离级别: 读未提交,读已提交,可重复读,串行化。一般常用的是读已提交,可重复读这两种。读已提交,可重复读 他们的快照读都是基于 mvcc 实现的。
mvcc 常见的几个概念:(图片来源百度)
(1)undo log
(2)版本链
id = 1 这条记录,经过了多次修改。 修改的历史版本都保存在了 undo log 里。数据库里的每行记录实际上包含一个回滚指针 ( 这是一个隐藏字段 ),指向上一个版本记录,如果你想得到 name=”张三“ 的记录,需要通过版本链多次回滚才行。
(3)Readview 可见性
readview 其实就是一次快照(相当于python 的 一个 class 对象),但是有个问题,当查询 select id=1 的时候,我应该读哪个版本呢,难道总是读最新吗? readview 的作用就是让你知道,你要选择读哪个快照版本。
readview 有一些参数:
m_ids: 表示在生成 Readview 时当前系统中活跃(指还未commit 的事务)的读写事务的 事务id 列表。
min_trx_id: 表示在生成 readview 时当前系统中活跃的读写事务最小的 事务id,也就是 m_ids 中最小的值。
max_trx_id: 表示生成 readview 时系统中应该分配下一个事务的 id 值。
create_trx_id: 表示生成 readview 的事务的 事务id。也就是谁生成了这个 readview。(我自己的事务 id。相当于是 自己记录自己。 )
可能不太直观,举个栗子如下:
eg:当前实例中 show proceeelist 查看活跃的事务列表是 m_ids = [2,3,4, 5] ,那么 min_trx_id=2,max_trx_id=6。
readview 视图如何判断版本链中的哪个版本可用呢?他有4 种判断逻辑
【1】trx_id == create_trx_id: 可以访问这个版本; # trx_id 指的就是如下图中的每条记录的事务 ID。 trx_id == create_trx_id 意味着,这条记录是我自己本身(当前 session)生成的事务(readview),我读取我自己创建的这条记录,当然是可读的。别人不可读是为了阻塞,我自己不可能阻塞我自己,没有意义。
【2】trx_id < min_trx_id:可以访问这个版本。说明,我这个 trx_id 就不是一个活跃的 id ,他已经commit 了 。
【3】trx_id > max_trx_id: 不可以访问这个版本。因为 该 readview 还没有生成。
【4】min_trx_id <= trx_id <= max_trx_id : 如果 trx_id 在 m_ids 中,那么是不可以访问这个版本的,在 m_ids 列表里 说明当前事务是活跃事务。
MVCC 是针对 RC 和 RR 隔离级别的:
RC 和 RR 级别 本质的区别是他俩 生成 readview 的时机不同:
【1】RC 中 以每个 select 的查询为单位(update, delete 的查询也算),每次 select 都会生成一个新的 readview,如果一个事务执行的过程中执行了多次 select,那么事务执行的过程中就要生成多个 readview 。本质是一个事务生成了多了 readview 。 RC 有不可重复读的问题。
【2】RR 生成 readview 是以事务为单位的。比如一个事务有三个 select 语句,但是只会生成一个 readview,后面两个 select 使用的 readview 和 第一个一样,他不会再继续生成 readview,所以在可重复读级别下, readview 是以事务为级别的 ,一个事务只会生成一个 readview。RR 级别就是用这个方法解决了不可重复读的问题。
Eg: 我现在开启了一个事务,包含了两个 select 动作,在执行第一个 select 的时候生成了这个 readview,第一个 select 查询到的是 name=“张三”,那么就算另一个 session 的 update 事务 commit 了,我这个事务的第二个 select 查询用到的依然是 第一个 select 的 readview name = “张三”,第一次生成的 readview 是什么样,之后的这个 readview 就是什么样,直到我这个事务执行完毕。 RR 虽然解决了不可重复的问题,但还是存在 幻读的问题,所以要加锁( 间隙锁 + next key lock )解决幻读的问题。 幻读只是在 RR 级别才会出现的。
我们知道 快照读是通过 mvcc 实现的,当前读都是通过加锁实现的:快照读是如何解决幻读的问题呢?
RR 级别因为事务开始的时候只会生成一分 readview,那么外界再怎么对这个数据进行增加,都对我这个readview 视图没有影响,我读的还是我第一次生成的视图,外部的数据再怎么更新,新增,对于我这个视图都没有影响,这种方式解决了幻读的问题。
当前读是通过 间隙锁 + next key lock 实现,间隙锁是锁住了一段范围。RR 级别默认开启了间隙锁。
理解 MVCC的更多相关文章
- 【Mysql】深入理解 MVCC 多版本并发控制
MVCC MVCC(Multi-Version Concurrency Control),即多版本并发控制.是 innodb 实现事务并发与回滚的重要功能.锁机制可以控制并发操作,但是其系统开销较大, ...
- 多版本号并发控制(MVCC)在分布式系统中的应用
QQ群:289150599 问题 近期项目中遇到了一个分布式系统的并发控制问题.该问题能够抽象为:某分布式系统由一个数据中心D和若干业务处理中心L1,L2 ... Ln组成:D本质上是一个key-va ...
- InnoDB MVCC RR隔离级别下的数据可见性总结
一.背景 熟悉数据库隔离级别的人都知道,在RR(可重复读)隔离级别下,无论何时多次执行相同的SELECT快照读语句,得到的结果集都是完全一样的,即便两次SELECT语句执行期间,其他事务已经改变了该查 ...
- HBase并行写机制(mvcc)
HBase在保证高性能的同时,为用户提供了便于理解的一致性数据模型MVCC (Multiversion Concurrency Control),即多版本并发控制技术,把数据库的行锁与行的多个版本结合 ...
- 转: 多版本并发控制(MVCC)在分布式系统中的应用 (from coolshell)
from: http://coolshell.cn/articles/6790.html 问题 最近项目中遇到了一个分布式系统的并发控制问题.该问题可以抽象为:某分布式系统由一个数据中心D和若干业务 ...
- 多版本号并发控制(MVCC)在实际项目中的应用
近期项目中遇到了一个分布式系统的并发控制问题.该问题能够抽象为:某分布式系统由一个数据中心D和若干业务处理中心L1,L2 - Ln组成:D本质上是一个key-value存储,它对外提供基于HTTP协议 ...
- Kudu的概念术语
不多说,直接上干货! Columnar Data Store(列式数据存储) Kudu 是一个 columnar data store(列式数据存储).列式数据存储在强类型列中.由于几个原因,通过适当 ...
- 极客时间 mysql实战45讲下载读 08讲事务到底是隔离的还是不隔离的 笔记
笔记体会: 1.innodb支持RC和RR隔离级别实现是用的一致性视图(consistent read view) 2.事务在启动时会拍一个快照,这个快照是基于整个库的.基于整个库的意思就是说一个事务 ...
- MySQL实战45讲学习笔记:第八讲
一.今日内容概要 我在第 3 篇文章和你讲事务隔离级别的时候提到过,如果是可重复读隔离级别,事务 T 启动的时候会创建一个视图 read-view,之后事务 T 执行期间,即使有其他事务修改了数据,事 ...
随机推荐
- iOS - TableViewCell分割线 --By吴帮雷
千万别小看UI中得线,否则你的设计师和测试组会无休止地来找你的!!(如果是美女还好,如果是恐龙....) 在开发中运用最多的是什么,对,表格--TableView,之所以称作表格,是因为他天生带有分割 ...
- MySQL数据库授权与索引
MySQL数据库授权与索引 目录 MySQL数据库授权与索引 一.数据库用户授权 1. 授予权限 2. 查看权限 3. 删除权限 4. 全部权限(all privileges) 二.MySQL索引 1 ...
- 问题描述:Navicat连不上MySQL数据库
发现Navicat连不上MySQL后我首先觉得是MySQL的服务没有打开, 然后再cmd里面 启动MySQL服务 输入: net start mysql 发现没有此服务,然我网上找了一下 先初始化My ...
- linux_15
实现基于MYSQL验证的vsftpd虚拟用户访问 配置samba共享,实现/www目录共享 使用rsync+inotify实现/www目录实时同步 LVS调度算法总结 LVS的跨网络DR实现
- PHP面试常考内容之Memcache和Redis(1)
你好,是我琉忆.继上周(2019.2-11至2-15)发布的"PHP面试常考内容之面向对象"专题后,发布的第二个专题,感谢你的阅读.本周(2019.2-18至2-22)的文章内容点 ...
- 06.python语法入门--与用户交互、运算符
与用户交互 输入 input # python2与python3的区别 '''python3''' # 将获取到的用户输入赋值给变量名res res = input(' ...
- Flask中本地栈的使用
4种上下文变量 承接上一篇内容.当一个请求到来时,除了request被封装成全局变量之外,还有三个变量也是同样被封装成全局变量,那就是current_app.g.session.上面4个变量之所以能够 ...
- suse 12 二进制部署 Kubernetets 1.19.7 - 第13章 - 部署metrics-server插件
文章目录 1.13.0.创建metrics-server证书和私钥 1.13.1.生成metrics-server证书和私钥 1.13.2.开启kube-apiserver聚合配置 1.13.3.分发 ...
- 一文带你解读Spring5源码解析 IOC之开启Bean的加载,以及FactoryBean和BeanFactory的区别。
前言 通过往期的文章我们已经了解了Spring对XML配置文件的解析,将分析的信息组装成BeanDefinition,并将其保存到相应的BeanDefinitionRegistry中,至此Spring ...
- MShadow中的表达式模板
表达式模板是Eigen.GSL和boost.uBLAS等高性能C++矩阵库的核心技术.本文基于MXNet给出的教程文档来阐述MXNet所依赖的高性能矩阵库MShadow背后的原理. 编写高效的机器学习 ...