分布式事务和分布式hash
分布式事务是什么?
分布式事务就是保证各个微服务之间数据一致,本质上就是保证不同数据库的数据一致性。一致性状态包含
- 强一致性,任何时刻,所有节点中数据都是一样的
- 弱一致性,数据更新后,只能访问到部分节点数据或者是全部访问不到
- 最终一致性,不保证任何时刻一样,但随着时间推移最终会达到一致性状态
因此,存在如下几种方案:
2PC ,二阶段提交是一种尽量强一致性设计,引入一个事务协调者来协调和管理各参与者的提交和回滚,包含准备和提交两个阶段,阶段之间同步阻塞,准备阶段协调者有超时机制。
大致流程:
- 准备阶段 向各个参与者发送准备命令,可以理解为把除了提交事务之外的事情都做好。所有参与者都返回准备成功则下一阶段提交事务,否则下一阶段协调者就会向所有参与者发送回滚事务的请求,即分布式事务执行失败。
- 提交阶段 可能提交事务也可能回滚事务,并且存在回滚失败或者提交失败,失败之后就会不断重试。
存在问题:
- 单点故障。协调者是一个单点。解决办法,通过选举得到新的协调者,各个组件都记录log
- 同步阻塞,效率低。①阶段之间阻塞。②其中一个参与者占用了共享资源就只能阻塞等待。
- 不确定性。提交阶段协调者发送提交命令之后,只有一个参与者收到命令,但是两个都挂了,新的协调者并不知道接下来是提交或者是回滚。
- 数据不一致。极端条件下数据不一致。
场景:目前支付宝使用2PC两阶段提交思想实现了分布式事务服务,它是一个分布式事务框架,用来保障在大规模分布式环境下事务的最终一致性。
3PC,为了解决2PC的不确定性,包含准备,预提交,提交三个阶段。准备阶段只是询问参与者的状态,其他阶段分别对应2PC。相比2PC,参与者也有超时机制(防止在2PC协调者提交阶段准备发送命令的时候挂了,参与者一直阻塞等待的情况),并且新增了一个阶段使得故障恢复之后协调者的决策复杂度降低(解决2PC的不确定性,在将要发生不确定性时,新协调者发现有一个参与者处于预提交或者提交阶段,那么表明已经经过了所有参与者的确认了,所以此时执行的就是提交命令)
场景:没有找到具体实现,偏理论。
2PC 和 3PC 都不能保证数据100%一致,因此一般都需要有定时扫描补偿机制。
TCC,2PC 和 3PC 都是数据库层面的,而 TCC 是业务层面的分布式事务。TCC指的是Try - Confirm - Cancel
- try,即资源的预留和锁定。
- Confirm,指的是确认操作,其实就是真正的执行。
- Cancel,指的时撤销操作,可以理解为撤销预留阶段的动作。
其也存在一个事务管理者,用来记录TCC全局事务状态提交或者回滚。其流程和2PC差不多。但业务的侵入较大、业务耦合度高,需要将原来一个接口可以实现的逻辑拆分为三个接口。
场景:TCC 需要提供三个接口,提高了编程的复杂性,并且依赖于业务方来配合提供这样的接口,推行难度大,所以一般不推荐使用这种方式。
本地消息表,利用各个系统本地事务来实现分布式事务。系统中会定义一个存放本地消息的表,一般都是放在数据库中。
大致流程:
- 当A被其他系统调用需要业务执行时,将业务的执行操作和将消息放入本地消息表中的操作放在同一个事务中。
- A定时轮询本地消息表往mq中生产消息,失败则重试。
- B消费mq中的消息,并处理业务逻辑,如果本地事务失败则重试,如果是业务失败则通知A进行回滚。
场景:跨行转账可通过该方案实现。在银行一的用户A向银行二的用户B转账
- 银行一:在一个本地事务中扣掉A的钱并将转账消息写入本地消息表中,如果本地事务失败则失败,如果本地事务成功,系统定时轮询消息表并往mq中生产转账消息,失败则重试。
- 银行二:mq 消息会被银行二消费并往 B 的账户增加转账金额,执行失败会不断重试。
消息事务,只有阿里的RocketMQ支持,实现了最终一致性。
大致流程:
- A向mq发送准备消息,失败则直接取消,成功则执行本地事务。
- 本地事务执行成功,向mq发送确认消息,失败则回滚消息。
- B定期消费mq中的确认消息,执行本地事务并回送ack消息,如果本地事务执行失败,会不断尝试,如果是业务失败,会向A发起回滚请求。
- mq会定期轮询所有准备消息,调用A提供的反查事务状态接口,如果该准备消息本地事务执行成功则重发确认消息,否者直接回滚。
场景:用户注册成功后发送邮件、电商系统给用户发送优惠券等需要保证最终一致性的场景。
最大努力通知,是最简单的一种柔性事务,适用于一些对最终一致性不敏感的业务,且被动方的处理结果,并不会影响主动方的处理结果。
大致流程:
- A本地事务执行完成之后,向MQ生产消息。
- 会存在一个服务消费MQ消息并调用系统B的接口。
- 如果B执行成功则OK,否则会一直尝试N次,超过则放弃。
场景:最常见的场景就是支付回调,支付服务收到第三方服务支付成功通知后,先更新自己库中订单支付状态,然后同步通知订单服务支付成功。如果此次同步通知失败,会通过异步脚步不断重试地调用订单服务的接口。
分布式Hash是什么?
我们从分布式系统中负载均衡的问题来描述分布式hash。
常见的负载均衡算法如下:
随机访问策略。随机访问,可能造成服务器负载压力不均衡。
轮询策略。请求均匀分配,但是浪费了性能高的服务器的资源。
权重轮询策略。根据权重轮询,权重需要静态配置,无法自动调节。
Hash取模策略。通过hash取模,伸缩性差,当新增或者下线服务器机器时候,用户与服务器的映射关系会大量失效。
一致性哈希策略。简单来说就是将整个哈希值(int范围)空间组织成一个虚拟的hash圆环,将每个服务器标识符跟int最大hash取模,得到一些对应在hash环上的点。用户在访问的时候,根据用户的标识符使用同样的hash函数取模,得到hash环上的一点,但这一点很可能没有服务器映射在上面,所以会顺时针行走,遇到的第一台服务器就是应该处理该用户请求的服务器。
优点:
- 可以任意动态添加、删除节点,每次添加、删除一个节点仅影响hash环上相邻的节点。
缺点:
- 会存在数据倾斜问题,因为hash值范围很大(int范围),用户请求量也很大(hash取模分布相对均匀),而服务器数量相对很少(hash取模分布很不均匀),就会造成数据倾斜问题。解决办法就是设置虚拟服务器,每个真实服务器映射很多个虚拟服务器,这样服务器数据大幅增加,hash取模分布相对均匀。
分布式事务和分布式hash的更多相关文章
- 分布式之分布式事务、分布式锁、接口幂等性、分布式session
一.分布式session session 是啥?浏览器有个 cookie,在一段时间内这个 cookie 都存在,然后每次发请求过来都带上一个特殊的 jsessionid cookie,就根据这个东西 ...
- 分布式事务(一)两阶段提交及JTA
原创文章,同步发自作者个人博客 http://www.jasongj.com/big_data/two_phase_commit/ 分布式事务 分布式事务简介 分布式事务是指会涉及到操作多个数据库(或 ...
- php + mysql 分布式事务(转)
事务(Transaction)是访问并可能更新数据库中各种数据项的一个程序执行单元: 事务应该具有4个属性:原子性.一致性.隔离性.持续性 原子性(atomicity).一个事务是一个不可分割的工作单 ...
- mysql 分布式事务
php + mysql 分布式事务 事务(Transaction)是访问并可能更新数据库中各种数据项的一个程序执行单元: 事务应该具有4个属性:原子性.一致性.隔离性.持续性 原子性(atomicit ...
- 浅述Oracle分布式事务概念
着系统的复杂性不断增加,我们所面对的分布式系统渐渐增加.分布式文件系统.分布式消息队列系统等等层出不穷,在一些行业特别是互联网行业应用广泛.分布式数据库也是目前使用比较常用的分布式系统之一. 简单来说 ...
- Spring+JTA+Atomikos+mybatis分布式事务管理
我们平时的工作中用到的Spring事务管理是管理一个数据源的.但是如果对多个数据源进行事务管理该怎么办呢?我们可以用JTA和Atomikos结合Spring来实现一个分布式事务管理的功能.了解JTA可 ...
- 使用“消息服务框架”(MSF)实现分布式事务的三阶段提交协议(电商创建订单的示例)
1,示例解决方案介绍 在上一篇 <消息服务框架(MSF)应用实例之分布式事务三阶段提交协议的实现>中,我们分析了分布式事务的三阶段提交协议的原理,现在我们来看看如何使用消息服务框架(MSF ...
- j2ee中spring的分布式事务实现及解决方案
1 java事务类型 Java事务的类型有三种:JDBC事务.JTA(Java Transaction API)事务.容器事务. 常见的容器事务如Spring事务,容器事务主要是J2EE应用服务器提供 ...
- 如何选择分布式事务形态(TCC,SAGA,2PC,补偿,基于消息最终一致性等等)
各种形态的分布式事务 分布式事务有多种主流形态,包括: 基于消息实现的分布式事务 基于补偿实现的分布式事务(gts/fescar自动补偿的形式) 基于TCC实现的分布式事务 基于SAGA实现的分布式事 ...
随机推荐
- Python多线程-ThreadLocal
参考:https://www.liaoxuefeng.com/wiki/1016959663602400/1017630786314240#0 ThreadLocal ThreadLocal变量虽然是 ...
- 机器学习 | 详解GBDT梯度提升树原理,看完再也不怕面试了
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是机器学习专题的第30篇文章,我们今天来聊一个机器学习时代可以说是最厉害的模型--GBDT. 虽然文无第一武无第二,在机器学习领域并没有 ...
- sockjs.js?9be2:1606 GET http://192.168.1.101:8080/sockjs-node/info?t=1583642185049 net::ERR_CONNECTION_TIMED_OUT错误连接方式解决方法
在使用vue-cli脚手架创建项目的时候,在cnpm create app命令后,项目创建成功后通过npm run serve命令运行以后,控制台报错,sockjs.js?9be2:1606 GET ...
- MyBatisPlus分页查询,删除操作
分页查询 分页查询在网页使用十分之多 原始的limit进行分页 pageHelper第三方插件 3. MP内置的分页插件 导入配置 如何使用,官网的代码如下 //分页插件 @Bean public P ...
- SqlServer 版本号
RTM (no SP) SP1 SP2 SP3 SP4 SQL Server 2014 codename Hekaton 12.00.2000.8 SQL Server 2012 ...
- 某大型企业ospf面试题分析(含路由策略和路由过滤,及双点双向重发布)
面试问题背景 本面试题来自国内最大通信技术公司之一,央企,有很多金融网项目. 了解行业的同学,一定知道事哪个企业. 上面试问题(取自百哥收集整理的面试总结大全,关注百哥CSDN或知乎,不定期分享名企面 ...
- C#LeetCode刷题之#867-转置矩阵(Transpose Matrix)
问题 该文章的最新版本已迁移至个人博客[比特飞],单击链接 https://www.byteflying.com/archives/3756 访问. 给定一个矩阵 A, 返回 A 的转置矩阵. 矩阵的 ...
- Manacher(马拉车)算法(jekyll迁移)
layout: post title: Manacher(马拉车)算法 date: 2019-09-07 author: xiepl1997 cover: 'assets/img/manacher.p ...
- Python+Pytest+Allure+Git+Jenkins接口自动化框架
Python+Pytest+Allure+Git+Jenkins接口自动化框架 一.接口基础 接口测试是对系统和组件之间的接口进行测试,主要是效验数据的交换,传递和控制管理过程,以及相互逻辑依赖关系. ...
- Mybatis如何在插入(ID是后台生成的)后返回ID?
获得ID方法: