Fescar锁和隔离级别的理解
前几天夜里,我老大发我一篇文章说阿里的GTS开源了。 因为一直对分布式事务比较感兴趣,立马pull了代码,进行阅读。基本的原理,实现方案我就不一一细化了,详细见官方文档(写的很棒,点赞)。
在fescar的社区,大家比较关注的是通过fescar回滚到before快照前,别的线程假如更新了数据,且业务走完了,那么恢复的这个快照不就是脏数据了么。 很显然,这种情况在fescar中是不被允许的。
那么fescar是如何做的呢?
我们先简单了解一下fescar的设计原理 |
那些一上来就喜欢看源码的同学,一定不要错过这么官方的图文介绍,看完再读源码事半功倍。
了解完Fescar的基本原理,我们重点关注下Fescar的全局排他锁 |
Fescar设计了一个全局的排他锁,来保证事务间的 写隔离。
关于隔离性:(这是Fescar官方给的一段话)
全局事务的隔离性是建立在分支事务的本地隔离级别基础之上的。
在数据库本地隔离级别 读已提交或以上 的前提下,Fescar 设计了由事务协调器维护的 全局写排他锁,来保证事务间的 写隔离,将 全局事务默认定义在 读未提交 的隔离级别上。
我们对隔离级别的共识是:绝大部分应用在读已提交的隔离级别下工作是没有问题的。而实际上,这当中又有绝大多数的应用场景,实际上工作在读未提交的隔离级别下同样没有问题。
在极端场景下,应用如果需要达到全局的读已提交,Fescar也提供了相应的机制来达到目的。 默认,Fescar 是工作在 读无提交 的隔离级别下,保证绝大多数场景的高效性。
我的解读
本地事务【读已提交】,fescar全局事务【读未提交】。这是这段话的核心。 我理解的这段话中fescar全局事务读未提交,并不是说本地事务的db数据没有正常提交,而是指全局事务二阶段commit|rollback未真正处理完(即未释放全局锁)。
总结来说:全局未提交但是本地已提交的数据,对其他全局事务是可见的【当然在本地事务提交后,本地事务提交前,隔离级别是本地事务的管辖范围】
for example 产品份额有5W,A用户购买了2万,份额branch一阶段完毕(本地事务份额已经扣除commit),但是在下单的时候异常了。 因为本地事务读已提交,这时候fescar允许业务访问该条数据,3W,在A用户的份额branch未回滚成功前,对其他用户可见。 但是其他用户并不能买该产品,必须等到产品份额回滚到5万,其他用户才可以操作产品数据。
所以看了这个例子 真的有必要做到全局事务读已提交么?
我们先来看一下Fescar的全局锁的做法 |
Fescar一阶段
1 本地(Branch)在向TC注册的时候,把本地事务需要修改的数据table+pks提交到server端申请锁,拿到全局锁后,才能提交本地事务
2 全局锁的结构:resourceId + table + pks
3 锁是存在server端 branchSession中
Fescar二阶段
一阶段本地事务提交,db的锁释放了(for update锁),但是全局锁继续保持, 直到二阶段决议(注意释放锁的顺序):
1 提交:TC 释放锁,通知branch提交后 (rm端异步处理)
2回滚:TC 通知branch回滚后,释放锁(rm端同步处理 执行undo_log)
Fescar如何保障锁的高效?
大家自己先思考下,最后给大家仔细解读官方的demo,并分析fescar的性能问题。
Fescar目前开源版本全局锁的实现
大家有兴趣自己阅读:com.alibaba.fescar.server.lock.DefaultLockManagerImpl
官方的图实在是做的太漂亮了,clone一份解读 TC TM RM 以及全局锁的获取和释放动作发生点
分支事务如何工作?关注全局锁的获取和释放 特别是二阶段commit和rollback全局锁释放的顺序
Fescar中 RM TM TC如何工作的?
看了这两张图,大家应该对fescar是如何工作的应该有一个大致的了解了。☺
1 全局锁的获取
2 tm tc rm之间如何通信工作
3 隔离级别问题的思考
最后我们来解读一遍官方的demo
1 branch1:update storagetbl set count = count - ? where commoditycode = ?
2 branch2:update accounttbl set money = money - ? where userid = ?
3 branch3:insert into ordertbl (userid, commodity_code, count, money) values (?, ?, ?, ?)
1 线程A:执行branch1(pk:55),执行branch2的时候发现没钱了,扔了一个异常,那么势必需要回滚branch1的份额。
TM通知TC开始回滚branch1份额中
2 线程B:执行branch1(pk:55)
如果线程A中branch1(pk:55)已经回滚成功了,那么B线程可以正常拿到锁走下去
如果线程A中branch1还未回滚(resourceId+table+pk锁未释放)。当线程B发起branch1向server发起申请锁,会直接失败。
Fescar全局锁简单总结:操作一条记录的分支事务,必须等待这条记录的前一个分支事务执行结束(具体commit rollback情况分析如下),才能持有锁。
其实相比XA的锁,fescar在每个分支事务的一阶段结束后都释放了db的锁,所以fescar的性能瓶颈应该在于二阶段的执行速度(释放锁的快慢)
因为分布式事务在执行事务编排前,一般会校验业务的正确性,所以发生回滚的概率相对较低,所以先考虑二阶段commit操作。
1. Commit场景分析:
TM通知server进行commit,server立马释 branch的锁,然后再逐个通知RM提交 消耗:1 rpc操作,(branch删除undo_log放在异步队列里面做)
2. Rollback场景分析:
TM通知server进行rollback,server通知RM回滚后立马释放 branch的锁。 消耗:1 + N的rpc操作 + N的回滚sql操作
所以总的来看fescar在commit的释放全局锁还是非常高效的。
思考
1. server支持多台机器部署,应该如何改造?
全局锁的问题,锁改造; 全局事务向server0申请的,Branch1发到server1,branch2发到server2的问题,多机器恢复的情况,TC的改造
2. 全局锁在Fescar中更新确实是没有问题的,但是如果就是业务方需要手动调整DB数据呢 ?
大胆猜测,依赖Fescar写了一个管理平台 用来执行sql的。哈哈
3. 隔离级别的思考
Fescar默认工作在,本地事务读已提交,全局事务读未提交。 是否存在全局事务必须工作在【读已提交】级别而不能工作在【读未提交】的业务场景呢? 大家大胆脑洞 这个问题值得探讨。
4. Fescar的文档中说,是支持全局事务读已提交的,那么fescar是如何实现的呢?
感兴趣的同学可以试着读一下
com.alibaba.fescar.rm.datasource.exec.SelectForUpdateExecutor
源码核心类
大家想读源码的话,可以重点关注一下几个类。有问题一起探讨。
TM相关
com.alibaba.fescar.tm.api.TransactionalTemplate
RM相关
com.alibaba.fescar.rm.datasource.exec.SelectForUpdateExecutor
com.alibaba.fescar.rm.datasource.ConnectionProxy
com.alibaba.fescar.rm.datasource.exec.AbstractDMLBaseExecutor
com.alibaba.fescar.rm.RMHandlerAT
TC相关
com.alibaba.fescar.server.coordinator.DefaultCoordinator
com.alibaba.fescar.server.coordinator.DefaultCore
com.alibaba.fescar.server.lock.DefaultLockManagerImpl
文章转自于* 铜板街公众号
Fescar锁和隔离级别的理解的更多相关文章
- java面试-公平锁/非公平锁/可重入锁/递归锁/自旋锁谈谈你的理解
一.公平锁/非公平锁/可重入锁/递归锁/自旋锁谈谈你的理解 公平锁:多个线程按照申请的顺序来获取锁. 非公平锁:多个线程获取锁的先后顺序与申请锁的顺序无关.[ReentrantLock 默认非公平.s ...
- 万向节锁(Gimbal Lock)的理解
[TOC] 结论 我直接抛出结论: Gimbal Lock 产生的原因不是欧拉角也不是旋转顺序,而是我們的思维方式和程序的执行逻辑没有对应,也就是说是我们的观念导致这个情况的发生. 他人解释 首先我们 ...
- Oracle和sqlserver关于锁和隔离级别的差异
事务属性:ACID(原子性.一致性.隔离性.持久性) 隔离级别:主要针对的是共享锁的持有时间和范围 SQL标准定义了以下四种事务隔离级别 READ UNCOMMITTED 允许脏读. 不可重 ...
- 对SQL Server事务的4个隔离级别的理解
事务隔离级别的简单理解 ANSI/ISO SQL标准定义了4种事务隔离级别,这些隔离级别是根据事务并行出现的4个"现象"定义的. 4个现象是: 1.更新丢失(Lost Upda ...
- 从ReentrantLock实现非公平锁的源码理解AQS中的CLH队列
虽然前面也看过AQS的文章,并且转载过一篇大佬的分析,但是我觉得他们对于AQS和ReentrantLock部分的源码的分析并不详细,自己理解期来还是有问题,于是自己准备花时间重新梳理下,好了,进入正题 ...
- SQL中锁表语句简单理解(针对于一个表)
锁定数据库的一个表 复制代码代码如下: SELECT * FROM table WITH (HOLDLOCK) 注意: 锁定数据库的一个表的区别 复制代码代码如下: SELECT * FROM tab ...
- Redis分布式锁的一点小理解
1.在分布式系统中,我们使用锁机制只能保证同一个JVM中一次只有一个线程访问,但是在分布式的系统中锁就不起作用了,这时候就要用到分布式锁(有多种,这里指 redis) 2.在 redis当中可以使用命 ...
- 【转】T-SQL查询进阶—理解SQL Server中的锁
简介 在SQL Server中,每一个查询都会找到最短路径实现自己的目标.如果数据库只接受一个连接一次只执行一个查询.那么查询当然是要多快好省的完成工作.但对于大多数数据库来说是需要同时处理多个查 ...
- 深入理解MYSQL的MDL元数据锁
1 前言 2 MDL锁与实现 3 MDL锁的性能与并发改进 4 MDL锁的诊断 前言 好久没更新,主要是因为Inside君最近沉迷于一部动画片——<新葫芦娃兄弟>.终于抽得闲,完成了本篇关 ...
随机推荐
- 关于域名解析|A记录|CNAME等
1. A记录 又称IP指向,用户可以在此设置子域名并指向到自己的目标主机地址上,从而实现通过域名找到服务器. 说明: ·指向的目标主机地址类型只能使用IP地址: 附加说明: 1) 泛域名解析 即将该域 ...
- 安卓控件支持HTML标签
http://www.cnblogs.com/xqxacm/p/5092557.html
- Java泛型(1):概述
通常而言,我们使用一种容器来存储一种类型的对象.而泛型的主要目的之一就是用来指定这个容器要持有什么类型的对象.因此,与其使用Object,我们可以暂时不指定类型. 看下面3个例子: (1) 我们有时候 ...
- 在java中有关于反射的皮毛----自己的简略认知
白首为功名.旧山松竹老,阻归程.欲将心事付瑶琴.知音少,弦断有谁听? 反射(reflection): 当我们在看到这个名词首先会想到的是,我们在上高中时学的物理,那么在java开发中,反射这个名词是怎 ...
- 【HANA系列】SAP HANA SQL IFNULL和NULLIF用法与区别
公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[HANA系列]SAP HANA SQL IFN ...
- 【CodeForces - 707B】Bakery(思维水题)
Bakery Descriptions 玛莎想在从1到n的n个城市中开一家自己的面包店,在其中一个城市烘焙松饼. 为了在她的面包房烘焙松饼,玛莎需要从一些储存的地方建立面粉供应.只有k个仓库,位于不同 ...
- Pandas导入导出&pickle文件模块
Pandas可以读取与存储的文件格式有很多 像csv,excel,json,html等,详细请看官方文档https://pandas.pydata.org/pandas-docs/stable/use ...
- day37 GIL、同步、异步、进程池、线程池、回调函数
1.GIL 定义: GIL:全局解释器锁(Global Interpreter Lock) 全局解释器锁是一种互斥锁,其锁住的代码是全局解释器中的代码 为什么需要全局解释器锁 在我们进行代码编写时,实 ...
- 【LOJ】#3033. 「JOISC 2019 Day2」两个天线
LOJ#3033. 「JOISC 2019 Day2」两个天线 用后面的天线更新前面的天线,线段树上存历史版本的最大值 也就是线段树需要维护历史版本的最大值,后面的天线的标记中最大的那个和最小的那个, ...
- 洛谷P2622 关灯问题II (二进制枚举+bfs
题目描述 现有n盏灯,以及m个按钮.每个按钮可以同时控制这n盏灯——按下了第i个按钮,对于所有的灯都有一个效果.按下i按钮对于第j盏灯,是下面3中效果之一:如果a[i][j]为1,那么当这盏灯开了的时 ...