在应用中,会将一系列相关的操作定义为一个连续的操作,当其中一个或者多个步骤失败的时候,Compensating-Transaction模式会重置(回滚)这个连续的操作。在云应用中,这些需要保证一致性的操作是较为常见的,正是这些操作构成了复杂的业务处理和工作流。

问题

云中运行的应用会频繁的修改数据。数据可能会传播到另外一组数据源,但是数据库却可能在不同的地方。为了避免竞争并且增加诸如此类分布式环境的性能,应用应该尽量少的提供强事务一致性的功能。应用可以实现最终一致性的。在最终一致性模型中,大多数业务操作都会包含多个自主的子步骤。这些子步骤在执行的过程中,整个系统的状态可能是不一致的,但是当所有的子步骤都执行完毕的时候,整个系统状态会重新变成一致的。

Data Consistency Primer章节中对分布式事务的规模化,以及设计最终一致模型的一些准则提供了更多的信息。

在最终一致模型中,一个严峻的问题就是一旦其中一个步骤发生了严重的错误,该如何处理。一旦发生了严重的错误的话,回滚之前的工作就十分必要了。然而,数据是无法简单的回滚的,因为其他应用的并发实例可能在那之后仍然改变数据再次覆盖。甚至就算是并发实例的状态并没有改变的情况下,回滚也不是简单的恢复到原始状态就能解决的。可能还需要应用一些应用所特有的逻辑。

如果实现了最终一致性的操作会跨越多个数据仓库的话,回滚这个操作就需要按相反的顺序重新访问所有数据仓库了。而每个数据仓库的回滚操作也必须完成,才能防止系统出现数据的不一致。

并不是所有的实现数据一致性的操作访问的数据都在同一个数据库中的。在SOA环境中,一个操作很可能会调用另一个Service服务,从而引起另一个服务状态的改变。为了回滚之前的操作,调用的Service的状态也必须回滚。这可能就会需要再次调用Service,并且执行相反的操作才可以。

解决方案

基于前面的问题,可以考虑实现Compensating-Transaction模式。在Compensating-Transaction模式中,所有的步骤都必须能够重置之前的工作。Compensating-Transaction可能无法仅仅通过将之前的状态替换掉现在的状态这种方式来回滚,前面已经提到过了,因为这个方法可能会覆盖或者被其他并发实例的操作所覆盖。所以,回滚必须相当的智能,考虑到所有并发应用实例所造成的影响。同时这种回滚行为通常是与应用相关的,要取决于应用执行操作的一些具体的特性。

通常实现最终一致性的操作就是通过workflow来补偿之前的操作。随着操作的进行,系统记录每一步所执行的信息,以及操作执行后该如何回滚。如果操作在任何一个步骤失败了,workflow会倒回所有已经完成的操作,并根据记录的信息进行回滚。需要注意的是,Compensating-Transaction没有必要按照之前执行顺序的逆序来依次执行回滚操作,Compensating-Transaction可能将某些操作以并行的方式来完成的。

这个方法类似于Sagas策略,具体可以参考Sagas模式

Compensating-Transaction本身也是一种最终一致性的操作,所以也可能会失败的。系统应该能够同样在Compensating-Transaction失败的步骤进行重试和继续执行。有时候,重复之前失败的操作也是很有必要的。所以Compensating-Transaction中的操作都应该定义为幂等的操作。关于幂等的更多的信息,可以参考幂等模式

在一些情况下,可能是无法以非手动的方式来执行回滚的。在这些情况下,系统就需要发出报警,并且提供足够的信息给操作人员,让操作人员可以了解产生错误的原因,以及如何恢复回来。

需要考虑的问题

在实现Compensating-Transaction模式的时候,需要考虑如下的问题:

  • 在考虑实现最终一致性的时候,有时判断某个步骤是否失败可能很难。因为其中的一步可能不是立刻返回失败信息,而是持续的阻塞,所以考虑使用一些超时的机制是十分必要的。
  • 补偿逻辑是很难抽象和泛华的。所以Compensating-Transaction一般都是基于应用特性的,这也令Compensating-Transaction十分依赖应用的业务,只有足够的信息才能回滚每个失败的步骤。
  • 开发者实现Compensating-Transaction的时候最好将其中的每一个步骤都定义为幂等的。这样可以在Compensating-Transaction回滚中某些步骤失败的时候可以从容的进行重试,而不用担心重试操作会影响到服务的状态。
  • 整个架构要处理正常流程中操作和Compensating-Transaction必须是可恢复的。补偿逻辑所需要的信息不可或缺。而且架构必须能够可靠地监控补偿逻辑的处理过程。防止出现循环等状况。
  • Compensating-Transaction只补偿失败步骤之前执行成功了的操作。
  • 在Compensating-Transaction的回滚过程中,回滚操作的执行顺序不必非要以之前执行的顺序的逆序来依次回滚。比如,如果其中一个数据仓库对于数据一致性更加敏感,那么优先补偿该数据仓库就更为重要。
  • 最好在每个需要完成操作的资源上面加上一个超时锁,并且提前获取相应的资源,这样可以增加整个事物的成功率。而所有的工作最好在获取了全部的资源之后再执行。所有的操作必须在锁过期之前全部完成。
  • Retry模式同时应用可以更好的减少错误,从而减少回滚操作。如果整个操作中的某个步骤失败了,尽量将这个失败当成一个临时错误来进行重试。只有当操作不断的失败或者无法修复的时候再去执行Compensating-Transaction的回滚操作。

    关于实现Compensating-Transaction中的很多问题,其实跟实现最终一致性所需要考虑的是一样的。可以查看Data Consistency Primer来了解更多的内容。

何时使用该模式

当某个操作中一旦出现失误必须回滚的时候可以考虑这个模式。如果可能的话,最好尽可能减少Compensating-Transaction的复杂性,更多信息可以参考Data Consistency Primer。

Compensating-Transaction使用举例

某个旅游网站支持用户来预订行程(包括机票以及酒店等)。一个行程可能包含多个航班以及酒店信息。假设一名旅客需要从西雅图到伦敦,然后到巴黎,在飞回西雅图的话,可能就会产生如下的行程:

  1. 预订某航班F1从西雅图飞往伦敦。
  2. 预订某航班F2从伦敦飞往巴黎。
  3. 预订某航班F3从巴黎飞往西雅图。
  4. 预订伦敦的某个酒店H1
  5. 预订巴黎的某个酒店H2

尽管上述的每个操作都是一个独立的原子行为,但是他们也构成了一个最终一致性操作。因此,随着上述操作的执行,系统也必须记录所有执行过的操作的补偿操作,一旦旅客想要取消行程,就要撤销整个之前的操作。所以这些补偿的操作就可以作为一个Compensating-Transaction来执行。

需要注意的是,Compensating-Transaction中的步骤其实并不需要完全按照之前执行的相反顺序来依次回滚的。而且Compensating-Transaction中的每个步骤都必须考虑到其相关的业务规则。例如,退订某个航班可能并不会返还给顾客当初所支付的全部金额。

在Compensating-Transaction中所执行的回滚操作也可能并行来执行的,完全取决于每一步的补偿逻辑具体是如何设计的。

在有些商业解决方案中,系统中某个步骤的失败也并不会破事整个系统,所以不需要通过Compensating-Transaction来回滚全部操作。仍然拿上面的例子来说,如果在预订了航班F1,F2,F3之后,客户无法预订到酒店H1的房间了,那么更好的选择是给客户提供一个其他酒店的房间而不是取消整个行程了。当然,旅客可能仍然会选择取消,但是这个选择的权利应该交给顾客而不是系统来帮助顾客取消了。

相关的其它模式

在实现Compensating-Transaction的时候,下面的模式以及相关信息也可以进行参考:

  • Data Consistency Primer Compensating-Transaction通常被用来回滚需要实现最终一致性模型的功能。Data Consistency Primer中的内容提供了更多关于最终一致性的特性的说明。
  • Scheduler-Agent-Supervisor 模式。该模式描述了如何实现一个尽可能利用分布式服务以及资源的弹性系统。在很多场景下,也会需要使用Compensating-Transaction来回滚失败的错误。
  • Retry模式。Compensating-Transaction实现起来代价是非常昂贵的,所以其中的一些步骤最好包含重试逻辑以便增加最终一致性模型的成功率,减少回滚的概率。

Compensating-Transaction模式的更多相关文章

  1. Compensating Transaction Pattern(事务修正模式)

    Undo the work performed by a series of steps, which together define an eventually consistent operati ...

  2. Event Sourcing Pattern 事件源模式

    Use an append-only store to record the full series of events that describe actions taken on data in ...

  3. 深入浅出设计模式——命令模式(Command Pattern)

    模式动机 在软件设计中,我们经常需要向某些对象发送请求,但是并不知道请求的接收者是谁,也不知道被请求的操作是哪个,我们只需在程序运行时指定具体的请求接收者即可,此时,可以使用命令模式来进行设计,使得请 ...

  4. 设计模式(十四):Command命令模式 -- 行为型模式

    1.概述         在软件设计中,我们经常需要向某些对象发送请求,但是并不知道请求的接收者是谁,也不知道被请求的操作是哪个,我们只需在程序运行时指定具体的请求接收者即可,此时,可以使用命令模式来 ...

  5. 设计模式 ( 十三 ) 命令模式Command(对象行为型)

    设计模式 ( 十三 ) 命令模式Command(对象行为型) 1.概述         在软件设计中,我们经常需要向某些对象发送请求,但是并不知道请求的接收者是谁,也不知道被请求的操作是哪个,我们只需 ...

  6. CSharp设计模式读书笔记(15):命令模式(学习难度:★★★☆☆,使用频率:★★★★☆)

    命令模式(Command Pattern):将一个请求封装为一个对象,从而让我们可用不同的请求对客户进行参数化:对请求排队或者记录请求日志,以及支持可撤销的操作.命令模式是一种对象行为型模式,其别名为 ...

  7. 命令模式(Command Pattern)

    命令模式属于对象的行为模式.命令模式又称为行动(Action)模式或交易(Transaction)模式.命令模式把一个请求或者操作封装到一个对象中.命令模式允许系统使用不同的请求把客户端参数化,对请求 ...

  8. 《JAVA与模式》之命令模式

    在阎宏博士的<JAVA与模式>一书中开头是这样描述命令(Command)模式的: 命令模式属于对象的行为模式.命令模式又称为行动(Action)模式或交易(Transaction)模式. ...

  9. java常用设计模式十二:命令模式

    一.概述 定义:命令(Command)模式又叫作动作(Action)模式或事务(Transaction)模式,是一种对象的行为模式.将一个请求封装为一个对象,从而使你可用不同的请求对客户进行参数化:对 ...

  10. 设计模式《JAVA与模式》之命令模式

    在阎宏博士的<JAVA与模式>一书中开头是这样描述命令(Command)模式的: 命令模式属于对象的行为模式.命令模式又称为行动(Action)模式或交易(Transaction)模式. ...

随机推荐

  1. 【Redis】Redis学习(七) Redis 持久化之RDB和AOF

    Redis 持久化提供了多种不同级别的持久化方式:一种是RDB,另一种是AOF. RDB 持久化可以在指定的时间间隔内生成数据集的时间点快照(point-in-time snapshot). AOF ...

  2. CSS 实例之翻转图片

    具体效果图如下: 主要用到的技术除了3D翻转和定位 ,还用到了一个新的属性 backface-visibility:visable|hidden; 该属性主要是用来设定元素背面是否可见. 具体的步骤如 ...

  3. 【Python】pydot安装失败解决方法

    使用keras时输出网络结构需要用到pydot,总是安装失败,最后按照下面这样的步骤成功了. 1.安装graphviz:pip install graphviz 2.安装graphviz软件,地址在: ...

  4. 负载均衡(Load Balancing)学习笔记(一)

    概述 在分布式系统中,负载均衡(Load Balancing)是一种将任务分派到多个服务端进程的方法.例如,将一个HTTP请求派发到实际的Web服务器中执行的过程就涉及负载均衡的实现.一个HTTP请求 ...

  5. guider – 全系统Linux性能分析器

    Guider是一个免费且开源的,功能强大的全系统性能分析工具,主要以Python for Linux 操作系统编写. 它旨在衡量系统资源使用量并跟踪系统行为,从而使其可以有效分析系统性能问题或进行性能 ...

  6. 转:C# 读取EXCEL文件的三种经典方法

    1.方法一:采用OleDB读取EXCEL文件: 把EXCEL文件当做一个数据源来进行数据的读取操作,实例如下: public DataSet ExcelToDS(string Path) { stri ...

  7. Python编写API接口

    要求通过http://192.168.50.74/aptest/calc/?a=aa&c=00&b=bb进行访问,参数a="aa",b="bb" ...

  8. Tmux 使用教程 on Fedora 28

    Tmux 和 gun/screen 都是优秀的终端复用软件,它的关键的好处就是,保持ssh 登录连接session不中断,并且能支持分屏操作,具备丰富的命令行参数,可以进行动态布局和操作.可以看作为s ...

  9. LabVIEW TCP/IP 断开重连问题

    LabVIEW的TCP/IP函数库非常好用,但是不恰当地设置打开连接结点的参数将带来一些问题,麻烦.如下图的打开连接的参数设置: 上图中指定了本地的端口,会发生这样的情况.当我们关闭应用程序之后,连接 ...

  10. [Spark Core] Spark 使用第三方 Jar 包的方式

    0. 说明 Spark 下运行job,使用第三方 Jar 包的 3 种方式. 1. 方式一 将第三方 Jar 包分发到所有的 spark/jars 目录下 2. 方式二 将第三方 Jar 打散,和我们 ...