服务容错处理库Polly使用

在进入SOA之后,我们的代码从本地方法调用变成了跨机器的通信。任何一个新技术的引入都会为我们解决特定的问题,都会带来一些新的问题。比如网络故障、依赖服务崩溃、超时、服务器内存与CPU等其它问题。正是因为这些问题无法避免,所以我们在进行系统设计、特别是进行分布式系统设计的时候以“Design For Failure”(为失败而设计)为指导原则。把一些边缘场景以及服务之间的调用发生的异常和超时当成一定会发生的情况来预先进行处理。

Design For Failure
1. 一个依赖服务的故障不会严重破坏用户的体验。
2. 系统能自动或半自动处理故障,具备自我恢复能力。

以下是一些经验的服务容错模式

  • 超时与重试(Timeout and Retry)
  • 限流(Rate Limiting)
  • 熔断器(Circuit Breaker)
  • 舱壁隔离(Bulkhead Isolation)
  • 回退(Fallback)

如果想详细了解这几种模式可以参考美团技术团队的总结:服务容错模式。我们今天要讲的是,thanks to the community 多谢社区, Polly已经为我们实现了以上全部的功能。Polly是一个C#实现的弹性瞬时错误处理库(resilience and transient-fault-handling library一直觉得这个英文翻译不是很好) 。在Polly中,对这些服务容错模式分为两类:

  • 错误处理fault handling :重试、熔断、回退
  • 弹性应变resilience:超时、舱壁、缓存

可以说错误处理是当错误已经发生时,防止由于该错误对整个系统造成更坏的影响而设置。而弹性应变,则在是错误发生前,针对有可能发生错误的地方进行预先处理,从而达到保护整个系统的目地。

  • Polly 错误处理使用三步曲
  1. 定义条件: 定义你要处理的 错误异常/返回结果
  2. 定义处理方式 : 重试,熔断,回退
  3. 执行

    先看一个简单的例子
// 这个例子展示了当DoSomething方法执行的时候如果遇到SomeExceptionType的异常则会进行重试调用。

var policy = Policy
.Handle<SomeExceptionType>() // 定义条件
.Retry(); // 定义处理方式 // 执行
policy.Execute(() => DoSomething());
定义条件
我们可以针对两种情况来定义条件:错误异常和返回结果。 // 单个异常类型
Policy
.Handle<HttpRequestException>() // 限定条件的单个异常
Policy
.Handle<SqlException>(ex => ex.Number == 1205) // 多个异常类型
Policy
.Handle<HttpRequestException>()
.Or<OperationCanceledException>() // 限定条件的多个异常
Policy
.Handle<SqlException>(ex => ex.Number == 1205)
.Or<ArgumentException>(ex => ex.ParamName == "example") // Inner Exception 异常里面的异常类型
Policy
.HandleInner<HttpRequestException>()
.OrInner<OperationCanceledException>(ex => ex.CancellationToken != myToken)
   以及用返回结果来限定 // 返回结果加限定条件
Policy
.HandleResult<HttpResponseMessage>(r => r.StatusCode == HttpStatusCode.NotFound) // 处理多个返回结果
Policy
.HandleResult<HttpResponseMessage>(r => r.StatusCode == HttpStatusCode.InternalServerError)
.OrResult<HttpResponseMessage>(r => r.StatusCode == HttpStatusCode.BadGateway) // 处理元类型结果 (用.Equals)
Policy
.HandleResult<HttpStatusCode>(HttpStatusCode.InternalServerError)
.OrResult<HttpStatusCode>(HttpStatusCode.BadGateway) // 在一个policy里面同时处理异常和返回结果。
HttpStatusCode[] httpStatusCodesWorthRetrying = {
HttpStatusCode.RequestTimeout, // 408
HttpStatusCode.InternalServerError, // 500
HttpStatusCode.BadGateway, // 502
HttpStatusCode.ServiceUnavailable, // 503
HttpStatusCode.GatewayTimeout // 504
};
HttpResponseMessage result = Policy
.Handle<HttpRequestException>()
.OrResult<HttpResponseMessage>(r => httpStatusCodesWorthRetrying.Contains(r.StatusCode))
.RetryAsync(...)
.ExecuteAsync( /* some Func<Task<HttpResponseMessage>> */ )
  • 定义处理方式

在这里使用的处理方式就是我们最开始说的服务容错模式,我们将介绍以下三种:重试、熔断、回退。

  • 重试

重试很好理解,当发生某种错误或者返回某种结果的时候进行重试。Polly里面提供了以下几种重试机制

  • 按次数重试
  1. 不断重试(直到成功)
  2. 等待之后按次数重试
  3. 等待之后不断重试(直到成功)
  4. 按次数重试
// 重试1次
Policy
.Handle<SomeExceptionType>()
.Retry() // 重试3(N)次
Policy
.Handle<SomeExceptionType>()
.Retry(3) // 重试多次,加上重试时的action参数
Policy
.Handle<SomeExceptionType>()
.Retry(3, (exception, retryCount) =>
{
// 干点什么,比如记个日志之类的
});
   不断重试 // 不断重试,直到成功
Policy
.Handle<SomeExceptionType>()
.RetryForever() // 不断重试,带action参数在每次重试的时候执行
Policy
.Handle<SomeExceptionType>()
.RetryForever(exception =>
{
// do something
});
   等待之后重试 // 重试3次,分别等待1、2、3秒。
Policy
.Handle<SomeExceptionType>()
.WaitAndRetry(new[]
{
TimeSpan.FromSeconds(1),
TimeSpan.FromSeconds(2),
TimeSpan.FromSeconds(3)
});
  

当然也可以在每次重试的时候添加一些处理,这里我们可以从上下文中获取一些数据,这些数据在policy启动执行的时候可以传进来。

Policy

.Handle()

.WaitAndRetry(new[]

{

TimeSpan.FromSeconds(1),

TimeSpan.FromSeconds(2),

TimeSpan.FromSeconds(3)

}, (exception, timeSpan, context) => {

// do something

});

  

把WiatAndRetry抱成WaitAndRetryForever()则可以实现重试直到成功。

熔断

熔断也可以被作为当遇到某种错误场景下的一个操作。以下代码展示了当发生2次SomeExceptionType的异常的时候则会熔断1分钟,该操作后续如果继续尝试执行则会直接返回错误 。

Policy

.Handle()

.CircuitBreaker(2, TimeSpan.FromMinutes(1));

  

可以在熔断和恢复的时候定义委托来做一些额外的处理。onBreak会在被熔断时执行,而onReset则会在恢复时执行。

熔断器状态

我们的CircuitBreakPolicy的State定义了当前熔断器的状态,我们也可能调用它的Is

Action<Exception, TimeSpan> onBreak = (exception, timespan) => { ... };

Action onReset = () => { ... };

CircuitBreakerPolicy breaker = Policy

.Handle()

.CircuitBreaker(2, TimeSpan.FromMinutes(1), onBreak, onReset);

  

olate和Reset方法来手动熔断和恢复 。

CircuitState state = breaker.CircuitState;

  

Closed 关闭状态,允许执行

Open 自动打开,执行会被阻断

Isolate 手动打开,执行会被阻断

HalfOpen 从自动打开状态恢复中,在熔断时间到了之后从Open状态切换到Closed

// 手动打开熔断器,阻止执行

breaker.Isolate();

// 恢复操作,启动执行

breaker.Reset();

  

回退(Fallback)

// 如果执行失败则返回UserAvatar.Blank

Policy

.Handle()

.Fallback(UserAvatar.Blank)

// 发起另外一个请求去获取值

Policy

.Handle()

.Fallback(() => UserAvatar.GetRandomAvatar()) // where: public UserAvatar GetRandomAvatar() { ... }

// 返回一个指定的值,添加额外的处理操作。onFallback

Policy

.Handle()

.Fallback(UserAvatar.Blank, onFallback: (exception, context) =>

{

// do something

});

  

执行polly policy

为我声明了一个Policy,并定义了它的异常条件和处理方式,那么接下来就是执行它。执行是把我们具体要运行的代码放到Policy里面。

// 执行一个Action

var policy = Policy

.Handle()

.Retry();

policy.Execute(() => DoSomething());

  

这就是我们最开始的例子,还记得我们在异常处理的时候有一个context上下文吗?我们可以在执行的时候带一些参数进去

// 看我们在retry重试时被调用的一个委托,它可以从context中拿到我们在execute的时候传进来的参数 。

var policy = Policy

.Handle()

.Retry(3, (exception, retryCount, context) =>

{

var methodThatRaisedException = context["methodName"];

Log(exception, methodThatRaisedException);

});

policy.Execute(

() => DoSomething(),

new Dictionary<string, object>() {{ "methodName", "some method" }}

);

  

当然,我们也可以将Handle,Retry, Execute 这三个阶段都串起来写。

Policy

.Handle(ex => ex.Number == 1205)

.Or(ex => ex.ParamName == "example")

.Retry()

.Execute(() => DoSomething());

  

Polly 弹性应变处理Resilience

我们在上面讲了Polly在错误处理方面的使用,接下来我们介绍Polly在弹性应变这块的三个应用: 超时、舱壁和缓存。

超时

Policy

.Timeout(TimeSpan.FromMilliseconds(2500))

  

支持传入action回调

Policy

.Timeout(30, onTimeout: (context, timespan, task) =>

{

// do something

});

  

超时分为乐观超时与悲观超时,乐观超时依赖于CancellationToken ,它假设我们的具体执行的任务都支持CancellationToken。那么在进行timeout的时候,它会通知执行线程取消并终止执行线程,避免额外的开销。下面的乐观超时的具体用法 。

// 声明 Policy

Policy timeoutPolicy = Policy.TimeoutAsync(30);

HttpResponseMessage httpResponse = await timeoutPolicy

.ExecuteAsync(

async ct => await httpClient.GetAsync(endpoint, ct),

CancellationToken.None

// 最后可以把外部的 CacellationToken附加到 timeoutPollcy的 CT上,在这里我们没有附加

);

  

悲观超时与乐观超时的区别在于,如果执行的代码不支持取消CancellationToken,它还会继续执行,这会是一个比较大的开销。

Policy

.Timeout(30, TimeoutStrategy.Pessimistic)

  

上面的代码也有悲观sad...的写法

Policy timeoutPolicy = Policy.TimeoutAsync(30, TimeoutStrategy.Pessimistic);

var response = await timeoutPolicy

.ExecuteAsync(

async () => await FooNotHonoringCancellationAsync(),

);// 在这里我们没有 任何与CancllationToken相关的处理

  

舱壁

在开头的那篇文章中详细解释了舱壁这种模式,它用来限制某一个操作的最大并发执行数量 。比如限制为12

Policy

.Bulkhead(12)

  

同时,我们还可以控制一个等待处理的队列长度

Policy

.Bulkhead(12, 2)

  

以及当请求执行操作被拒绝的时候,执行回调

Policy

.Bulkhead(12, context =>

{

// do something

});

  

缓存

Polly的缓存需要依赖于一个外部的Provider。

var memoryCacheProvider = new Polly.Caching.MemoryCache.MemoryCacheProvider(MemoryCache.Default);

var cachePolicy = Policy.Cache(memoryCacheProvider, TimeSpan.FromMinutes(5));

// 设置一个绝对的过期时间

var cachePolicy = Policy.Cache(memoryCacheProvider, new AbsoluteTtl(DateTimeOffset.Now.Date.AddDays(1));

// 设置一个滑动的过期时间,即每次使用缓存的时候,过期时间会更新

var cachePolicy = Policy.Cache(memoryCacheProvider, new SlidingTtl(TimeSpan.FromMinutes(5));

// 我们用Policy的缓存机制来实现从缓存中读取一个值,如果该值在缓存中不存在则从提供的函数中取出这个值放到缓存中。

// 借且于Polly Cache 这个操作只需要一行代码即可。

TResult result = cachePolicy.Execute(() => getFoo(), new Context("FooKey")); // "FooKey" is the cache key used in this execution.

// Define a cache Policy, and catch any cache provider errors for logging.

var cachePolicy = Policy.Cache(myCacheProvider, TimeSpan.FromMinutes(5),

(context, key, ex) => {

logger.Error($"Cache provider, for key {key}, threw exception: {ex}."); // (for example)

}

);

  

组合Policy

最后我们要说的是如何将多个policy组合起来。大致的操作是定义多个policy,然后用Wrap方法即可。

var policyWrap = Policy

.Wrap(fallback, cache, retry, breaker, timeout, bulkhead);

policyWrap.Execute(...)

  

在另一个Policy声明时组合使用其它外部声明的Policy。

PolicyWrap commonResilience = Policy.Wrap(retry, breaker, timeout);

Avatar avatar = Policy

.Handle()

.Fallback(Avatar.Blank)

.Wrap(commonResilience)

.Execute(() => { /* get avatar */ });

写在后面

上一篇我们介绍了《asp.net core开源api 网关Ocelot的中文使用文档》,Ocelot里面的一些关于Qos服务质量的处理就是用Polly来实现的。当然在没有网关介入的情况 下,我们也可以单独来使用Polly做弹性应对和瞬时错误处理。关于分布式架构,这是一个很大的话题,我们后面继续展示,欢迎关注 。

作者:Jesse 出处: http://jesse2013.cnblogs.com/

服务容错处理库Polly使用的更多相关文章

  1. ASP VNext 开源服务容错处理库Polly使用文档

    在进入SOA之后,我们的代码从本地方法调用变成了跨机器的通信.任何一个新技术的引入都会为我们解决特定的问题,都会带来一些新的问题.比如网络故障.依赖服务崩溃.超时.服务器内存与CPU等其它问题.正是因 ...

  2. 容错处理库Polly使用文档

    Design For Failure1. 一个依赖服务的故障不会严重破坏用户的体验.2. 系统能自动或半自动处理故障,具备自我恢复能力. 以下是一些经验的服务容错模式 超时与重试(Timeout an ...

  3. NET Core微服务之路:弹性和瞬态故障处理库Polly的介绍

    前言 上一节中我们介绍了Ocelot的常见使用配置,通过json配置文件,实现API网关的请求处理.和一个使用DownStream扩展下游中间件,来实现Http转RPC的简单实现,功能不算强大,但可以 ...

  4. 第五章 服务容错保护:Spring Cloud Hystrix

    在微服务架构中,我们将系统拆分为很多个服务,各个服务之间通过注册与订阅的方式相互依赖,由于各个服务都是在各自的进程中运行,就有可能由于网络原因或者服务自身的问题导致调用故障或延迟,随着服务的积压,可能 ...

  5. Dubbo服务容错(整合hystrix)

    简介:Hystrix旨在通过控制那些访问远程系统.服务和第三方库的节点从而对延迟和故障提供更强大的容错能力,Hystrix具备拥有回退机制和断路器功能的线程和信号隔离.请求缓存和请求打包以及监控和配置 ...

  6. 服务容错保护断路器Hystrix之七:做到自动降级

    从<高可用服务设计之二:Rate limiting 限流与降级>中的“自动降级”中,我们这边将系统遇到“危险”时采取的整套应急方案和措施统一称为降级或服务降级.想要帮助服务做到自动降级,需 ...

  7. 服务容错保护断路器Hystrix之三:断路器监控(Hystrix Dashboard)-单体监控

    turbine:英 [ˈtɜ:baɪn] 美 [ˈtɜ:rbaɪn] n.汽轮机;涡轮机;透平机 一.Hystrix Dashboard简介 在微服务架构中为了保证程序的可用性,防止程序出错导致网络阻 ...

  8. 服务容错保护断路器Hystrix之二:Hystrix工作流程解析

    一.总运行流程 当你发出请求后,hystrix是这么运行的 红圈 :Hystrix 命令执行失败,执行回退逻辑.也就是大家经常在文章中看到的“服务降级”. 绿圈 :四种情况会触发失败回退逻辑( fal ...

  9. 服务容错保护断路器Hystrix之一:入门示例介绍(springcloud引入Hystrix的两种方式)

    限流知识<高可用服务设计之二:Rate limiting 限流与降级> 在微服务架构中,我们将系统拆分成了一个个的服务单元,各单元间通过服务注册与订阅的方式互相依赖.由于每个单元都在不同的 ...

随机推荐

  1. 利用rem解决移动端响应适配问题

    最近看了<从网易与淘宝的font-size思考前端设计稿与工作流>和github上的<使用Flexible实现手淘H5页面的终端适配> 以前一直用百分比的我,对移动前端的H5页 ...

  2. 九度oj题目1342:寻找最长合法括号序列II

    题目1342:寻找最长合法括号序列II(25分) 时间限制:1 秒 内存限制:32 兆 特殊判题:否 提交:886 解决:361 题目描述: 假如给你一个由’(‘和’)’组成的一个随机的括号序列,当然 ...

  3. Linux 命令 -- chmod

    chmod命令用来变更文件或目录的权限.在UNIX系统家族里,文件或目录权限的控制分别以读取.写入.执行3种一般权限来区分,另有3种特殊权限可供运用.用户可以使用chmod指令去变更文件与目录的权限, ...

  4. 公用表表达式 (CTE)、递归

    指定临时命名的结果集,这些结果集称为公用表表达式 (CTE).公用表表达式可以包括对自身的引用.这种表达式称为递归公用表表达式. 对于递归公用表达式来说,实现原理也是相同的,同样需要在语句中定义两部分 ...

  5. 常用Oracle的SQL语句20181206更新

    --clob转字符串:dbms_lob.substr() --锁表:select object_name,machine,s.sid,s.serial# from v$locked_object l, ...

  6. Make sure that the controller has a parameterless public constructor.

    An error occurred when trying to create a controller of type 'CCD.Web.Controllers.TWAccountControlle ...

  7. PLC编程逻辑思路

    PLC编程逻辑思路 在整个执行过程的流程中,都是在不断地找启动条件,停止条件以及输出结果.当条件不够时,就得想办法如果添加标志位,根据已有条件去构造条件:当结果开发耦合时,就制造中间继电器去除耦合. ...

  8. SpringBoot 开启debug

    项目基于gradle ,今天想断点debug一下springboot,查阅资料后,纪录一下步骤. 创建Remote 创建gradle.properities 在当前项目下创建gradle.proper ...

  9. svn的使用总结

    在网上看到了以前介绍非常全的svn的文章,拿来分享 原文网址  http://www.cnblogs.com/jx270/archive/2013/03/04/2943595.html 还有一篇更基础 ...

  10. 工作中常用的sql语句以及知识整理

    一.常用的sql语句 1.建表语句 create table tabname(colname1 type1 [not null][primary key], colname2 type2,...) 根 ...