分布式事务是什么?


分布式事务就是保证各个微服务之间数据一致,本质上就是保证不同数据库的数据一致性。一致性状态包含

  • 强一致性,任何时刻,所有节点中数据都是一样的
  • 弱一致性,数据更新后,只能访问到部分节点数据或者是全部访问不到
  • 最终一致性,不保证任何时刻一样,但随着时间推移最终会达到一致性状态

因此,存在如下几种方案:

2PC ,二阶段提交是一种尽量强一致性设计,引入一个事务协调者来协调和管理各参与者的提交和回滚,包含准备和提交两个阶段,阶段之间同步阻塞,准备阶段协调者有超时机制。

大致流程:

  • 准备阶段 向各个参与者发送准备命令,可以理解为把除了提交事务之外的事情都做好。所有参与者都返回准备成功则下一阶段提交事务,否则下一阶段协调者就会向所有参与者发送回滚事务的请求,即分布式事务执行失败。
  • 提交阶段 可能提交事务也可能回滚事务,并且存在回滚失败或者提交失败,失败之后就会不断重试。

存在问题:

  • 单点故障。协调者是一个单点。解决办法,通过选举得到新的协调者,各个组件都记录log
  • 同步阻塞,效率低。①阶段之间阻塞。②其中一个参与者占用了共享资源就只能阻塞等待。
  • 不确定性。提交阶段协调者发送提交命令之后,只有一个参与者收到命令,但是两个都挂了,新的协调者并不知道接下来是提交或者是回滚。
  • 数据不一致。极端条件下数据不一致。

场景:目前支付宝使用2PC两阶段提交思想实现了分布式事务服务,它是一个分布式事务框架,用来保障在大规模分布式环境下事务的最终一致性。

3PC,为了解决2PC的不确定性,包含准备,预提交,提交三个阶段。准备阶段只是询问参与者的状态,其他阶段分别对应2PC。相比2PC,参与者也有超时机制(防止在2PC协调者提交阶段准备发送命令的时候挂了,参与者一直阻塞等待的情况),并且新增了一个阶段使得故障恢复之后协调者的决策复杂度降低(解决2PC的不确定性,在将要发生不确定性时,新协调者发现有一个参与者处于预提交或者提交阶段,那么表明已经经过了所有参与者的确认了,所以此时执行的就是提交命令)

场景:没有找到具体实现,偏理论。

2PC 和 3PC 都不能保证数据100%一致,因此一般都需要有定时扫描补偿机制。

TCC,2PC 和 3PC 都是数据库层面的,而 TCC 是业务层面的分布式事务。TCC指的是Try - Confirm - Cancel

  • try,即资源的预留和锁定。
  • Confirm,指的是确认操作,其实就是真正的执行。
  • Cancel,指的时撤销操作,可以理解为撤销预留阶段的动作。

其也存在一个事务管理者,用来记录TCC全局事务状态提交或者回滚。其流程和2PC差不多。但业务的侵入较大、业务耦合度高,需要将原来一个接口可以实现的逻辑拆分为三个接口。

场景:TCC 需要提供三个接口,提高了编程的复杂性,并且依赖于业务方来配合提供这样的接口,推行难度大,所以一般不推荐使用这种方式。

本地消息表,利用各个系统本地事务来实现分布式事务。系统中会定义一个存放本地消息的表,一般都是放在数据库中。

大致流程:

  • 当A被其他系统调用需要业务执行时,将业务的执行操作和将消息放入本地消息表中的操作放在同一个事务中。
  • A定时轮询本地消息表往mq中生产消息,失败则重试。
  • B消费mq中的消息,并处理业务逻辑,如果本地事务失败则重试,如果是业务失败则通知A进行回滚。

场景:跨行转账可通过该方案实现。在银行一的用户A向银行二的用户B转账

  • 银行一:在一个本地事务中扣掉A的钱并将转账消息写入本地消息表中,如果本地事务失败则失败,如果本地事务成功,系统定时轮询消息表并往mq中生产转账消息,失败则重试。
  • 银行二:mq 消息会被银行二消费并往 B 的账户增加转账金额,执行失败会不断重试。

消息事务,只有阿里的RocketMQ支持,实现了最终一致性。

大致流程:

  • A向mq发送准备消息,失败则直接取消,成功则执行本地事务。
  • 本地事务执行成功,向mq发送确认消息,失败则回滚消息。
  • B定期消费mq中的确认消息,执行本地事务并回送ack消息,如果本地事务执行失败,会不断尝试,如果是业务失败,会向A发起回滚请求。
  • mq会定期轮询所有准备消息,调用A提供的反查事务状态接口,如果该准备消息本地事务执行成功则重发确认消息,否者直接回滚。

场景:用户注册成功后发送邮件、电商系统给用户发送优惠券等需要保证最终一致性的场景。

最大努力通知,是最简单的一种柔性事务,适用于一些对最终一致性不敏感的业务,且被动方的处理结果,并不会影响主动方的处理结果。

大致流程:

  • A本地事务执行完成之后,向MQ生产消息。
  • 会存在一个服务消费MQ消息并调用系统B的接口。
  • 如果B执行成功则OK,否则会一直尝试N次,超过则放弃。

场景:最常见的场景就是支付回调,支付服务收到第三方服务支付成功通知后,先更新自己库中订单支付状态,然后同步通知订单服务支付成功。如果此次同步通知失败,会通过异步脚步不断重试地调用订单服务的接口。

分布式Hash是什么?


我们从分布式系统中负载均衡的问题来描述分布式hash。

常见的负载均衡算法如下:

随机访问策略。随机访问,可能造成服务器负载压力不均衡。

轮询策略。请求均匀分配,但是浪费了性能高的服务器的资源。

权重轮询策略。根据权重轮询,权重需要静态配置,无法自动调节。

Hash取模策略。通过hash取模,伸缩性差,当新增或者下线服务器机器时候,用户与服务器的映射关系会大量失效。

一致性哈希策略。简单来说就是将整个哈希值(int范围)空间组织成一个虚拟的hash圆环,将每个服务器标识符跟int最大hash取模,得到一些对应在hash环上的点。用户在访问的时候,根据用户的标识符使用同样的hash函数取模,得到hash环上的一点,但这一点很可能没有服务器映射在上面,所以会顺时针行走,遇到的第一台服务器就是应该处理该用户请求的服务器。

优点:

  • 可以任意动态添加、删除节点,每次添加、删除一个节点仅影响hash环上相邻的节点。

缺点:

  • 会存在数据倾斜问题,因为hash值范围很大(int范围),用户请求量也很大(hash取模分布相对均匀),而服务器数量相对很少(hash取模分布很不均匀),就会造成数据倾斜问题。解决办法就是设置虚拟服务器,每个真实服务器映射很多个虚拟服务器,这样服务器数据大幅增加,hash取模分布相对均匀。

分布式事务和分布式hash的更多相关文章

  1. 分布式之分布式事务、分布式锁、接口幂等性、分布式session

    一.分布式session session 是啥?浏览器有个 cookie,在一段时间内这个 cookie 都存在,然后每次发请求过来都带上一个特殊的 jsessionid cookie,就根据这个东西 ...

  2. 分布式事务(一)两阶段提交及JTA

    原创文章,同步发自作者个人博客 http://www.jasongj.com/big_data/two_phase_commit/ 分布式事务 分布式事务简介 分布式事务是指会涉及到操作多个数据库(或 ...

  3. php + mysql 分布式事务(转)

    事务(Transaction)是访问并可能更新数据库中各种数据项的一个程序执行单元: 事务应该具有4个属性:原子性.一致性.隔离性.持续性 原子性(atomicity).一个事务是一个不可分割的工作单 ...

  4. mysql 分布式事务

    php + mysql 分布式事务 事务(Transaction)是访问并可能更新数据库中各种数据项的一个程序执行单元: 事务应该具有4个属性:原子性.一致性.隔离性.持续性 原子性(atomicit ...

  5. 浅述Oracle分布式事务概念

    着系统的复杂性不断增加,我们所面对的分布式系统渐渐增加.分布式文件系统.分布式消息队列系统等等层出不穷,在一些行业特别是互联网行业应用广泛.分布式数据库也是目前使用比较常用的分布式系统之一. 简单来说 ...

  6. Spring+JTA+Atomikos+mybatis分布式事务管理

    我们平时的工作中用到的Spring事务管理是管理一个数据源的.但是如果对多个数据源进行事务管理该怎么办呢?我们可以用JTA和Atomikos结合Spring来实现一个分布式事务管理的功能.了解JTA可 ...

  7. 使用“消息服务框架”(MSF)实现分布式事务的三阶段提交协议(电商创建订单的示例)

    1,示例解决方案介绍 在上一篇 <消息服务框架(MSF)应用实例之分布式事务三阶段提交协议的实现>中,我们分析了分布式事务的三阶段提交协议的原理,现在我们来看看如何使用消息服务框架(MSF ...

  8. j2ee中spring的分布式事务实现及解决方案

    1 java事务类型 Java事务的类型有三种:JDBC事务.JTA(Java Transaction API)事务.容器事务. 常见的容器事务如Spring事务,容器事务主要是J2EE应用服务器提供 ...

  9. 如何选择分布式事务形态(TCC,SAGA,2PC,补偿,基于消息最终一致性等等)

    各种形态的分布式事务 分布式事务有多种主流形态,包括: 基于消息实现的分布式事务 基于补偿实现的分布式事务(gts/fescar自动补偿的形式) 基于TCC实现的分布式事务 基于SAGA实现的分布式事 ...

随机推荐

  1. NTFS 文件系统结构

    背景 NTFS 作为一个新的文件系统,因其安全性高而受到越来越多的重视,越来越多的应用采用了NTFS 文件系统.作为一个新的文件系统,NTFS 有着许多区别于FAT32 的优点,如磁盘配额.文件系统加 ...

  2. syslog协议及rsyslog服务全解析

    背景:需求来自于一个客户想将服务器的日志转发到自己的日志服务器上,所以希望我们能提供这个转发的功能,同时还要满足syslog协议. 一.什么是syslog协议 1.介绍(略) 2.syslog标准协议 ...

  3. Java web 小测验

    题目要求: 1登录账号:要求由6到12位字母.数字.下划线组成,只有字母可以开头:(1分) 2登录密码:要求显示“• ”或“*”表示输入位数,密码要求八位以上字母.数字组成.(1分) 3性别:要求用单 ...

  4. 《笨办法学Python 3》python入门书籍推荐|附下载方式

    <笨办法学Python 3>python入门书籍免费下载 内容简介 本书是一本Python入门书,适合对计算机了解不多,没有学过编程,但对编程感兴趣的读者学习使用.这本书以习题的方式引导读 ...

  5. Spring JdbcTemplate中关于RowMapper的使用实例

    在spring boot 集成使用jdbctemplate,首先在pom文件中引入相应的依赖 <dependency> <groupId>org.springframework ...

  6. 微信公众号如何将PDF上传到公众号?

    微信公众号如何将PDF上? 我们都知道创建一个微信公众号,在公众号中发布一些文章是非常简单的,但公众号添加附件下载的功能却被限制,如今可以使用小程序“微附件”进行在公众号中添加附件. 以下是公众号添加 ...

  7. AlgorithmMan,一套免费的算法演示神器

    概述 该文章的最新版本已迁移至个人博客[比特飞],单击链接 https://www.byteflying.com/archives/971 访问.  文章末尾附带GitHub开源下载地址. 0.概述 ...

  8. vue_如何判断变量是数组还是对象

    一.typeof判断数据类型(判断数组跟对象都返回object) console.log(typeof null); // "object" console.log(typeof ...

  9. JavaScript基础-06-正则表达式

    正则表达式 1. 正则表达式用于定义一些字符串的规则:计算机可以根据正则表达式,来检查一个字符串是否符合规则,将字符串中符合规则的内容提取出来. 2. 创建正则表达式对象: var reg=new R ...

  10. 掌握提高 Web 应用的性能的方法 之 优化 PHP 和 Laravel

    Laravel 有很多东西.但是快不是其中之一.让我们学习一些优化技巧,以加快运行速度! 自从 Laravel 诞生以来,没有一个 PHP 开发人员不受她的影响.他们是喜欢 Laravel 提供的快速 ...