Hystrix

说到Hystrix就得先说一下产生的背景等等,那就是雪崩效应. 在微服务中肯定存在多个服务层之间的调用,基础服务的故障可能会导致级联故障,进而造成整个系统不可用的情况,这种现象被称为服务雪崩效应. 简单的来说就是一种因"服务提供者"的不可用导致"服务消费者"的不可用,并将不可用逐渐放大的过程.如下图所示:

A是服务提供者,B是A的消费者,CD是B的消费者(这也就是前面说的服务者和提供者并没有明显的界限,一个服务可以是提供者,也可能是其它服务的提供者). A的不可用引起了B的不可用,并将不可用逐渐放大到CD,服务雪崩就形成了.

那归根结底,造成服务雪崩效应的原因如下:

  • 服务提供者不可用

    • 硬件故障
    • 程序Bug
    • 缓存击穿
    • 用户大量请求
  • 重试加大流量
    • 用户重试
    • 代码逻辑重试
  • 服务调用者不可用
    • 同步等待造成的资源耗尽

对于每一个原因都有对应的应对策略:

  • 流量控制

    • 网关限流
    • 用户交互限流
    • 关闭重试
  • 改进缓存模式
    • 缓存预加载
    • 同步改为异步刷新
  • 服务自动扩容
    • AWS的auto scaling
  • 服务调用者降级服务(Hystrix)
    • 资源隔离
    • 对依赖服务进行分类
    • 不可用服务的调用快速失败

而Hystrix就是为了预防链路雪崩效应产生的,下面说说Hystrix的特性.

Hystrix的特性

服务降级(Fallback)

Fallback相当于降级操作.对于查询操作,实现一个fallback方法,当请求后端服务出现异常的时候,可以使用fallback方法返回值,这个值一般是默认值或者来自缓存.

资源隔离

在 Hystrix 中,主要通过线程池来实现资源隔离。通常在使用的时候我们会根据调用的远程服务划分出多个线程池。例如调用产品服务的 Command 放入 A 线程池,调用账户服务的Command放入B线程池。这样做的主要优点是运行环境被隔离开了。这样就算调用服务的代码存在 bug 或者由于其他原因导致自己所在线程池被耗尽时,不会对系统的其他服务造成影响。

这样,通过对依赖服务实现线程池隔离,可以让应用更健壮,不会因为个别依赖服务出现问题而引起非相关服务的异常.但是这样要维护线程池会带来额外的开销, Netflix Hystrix 官方实例中,99%的情况下,使用线程池隔离的延迟有9ms,这个对于大多数需求来说几乎是没有影响;当然,如果觉得9ms的延迟开销接受不了,并且依赖服务足够可靠的情况下,可以使用信号模式来隔离资源,Hystrix在HystrixCommand 和 HystrixObservableCommand 中 2 处支持信号量的使用:

  • 命令执行:如果隔离策略参数 execution.isolation.strategy 设置为 SEMAPHORE,Hystrix 会使用信号量替代线程池来控制依赖服务的并发控制。
  • 降级逻辑:当 Hystrix 尝试降级逻辑时候,它会在调用线程中使用信号量。

信号量的默认值为 10,也可以通过动态刷新配置的方式来控制并发线程的数量。

断路器机制

当Hystrix Command请求后端服务失败数量超过一定比例(默认50%), 断路器会切换到开路状态(Open). 这时所有请求会直接失败而不会发送到后端服务. 断路器保持在开路状态一段时间后(默认5秒), 自动切换到半开路状态(HALF-OPEN). 这时会判断下一次请求的返回情况, 如果请求成功, 断路器切回闭路状态(CLOSED), 否则重新切换到开路状态(OPEN). Hystrix的断路器就像我们家庭电路中的保险丝, 一旦后端服务不可用, 断路器会直接切断请求链, 避免发送大量无效请求影响系统吞吐量, 并且断路器有自我检测并恢复的能力.

使用Feign Hystrix

熔断一般是用在服务调用者层面,所以在上一个eureka项目中,修改调用者.在配置文件中添加

feign.hystrix.enabled=true

创建回调类:

@Component
public class HelloRemoteHystrix implements HelloRemote { @Override
public String hello(@RequestParam(value = "name") String name) {
return "Hello World!!!";
}
}

添加fallback,修改远程调用的接口

@FeignClient(name = "eureka-service-producter",fallback = HelloRemoteHystrix.class)
public interface HelloRemote { /**
* 远程调用提供者的hello
* @param name
* @return
*/
@GetMapping("/hello")
public String hello(@RequestParam("name") String name); }

这个时候三个都启动的话,访问http://localhost:9010/hello/wangzhi会显示提供者的helloController中hello方法返回的内容,这个时候将提供者服务关掉,再次访问就会返回回调类的内容,也就是Hello World!!!

最后说一句,使用Hystrix,可以有效的防止雪崩,同时使系统具有自动降级和自动恢复服务的效果.

Hystrix Dashboard和Turbine

Hystrix-dashboard是一款针对Hystrix进行实时监控的工具,通过Hystrix Dashboard我们可以在直观地看到各Hystrix Command的请求响应时间, 请求成功率等数据。但是只使用Hystrix Dashboard的话, 你只能看到单个应用内的服务信息, 这明显不够. 我们需要一个工具能让我们汇总系统内多个服务的数据并显示到Hystrix Dashboard上, 这个工具就是Turbine.

Hystrix Dashboard

创建标准的SpringBoot项目hystrix-dashborad-demo,添加依赖,添加注解,添加配置,代码如下:

<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
</dependency> @EnableHystrixDashboard
@SpringBootApplication
public class HystrixDashboradDemoApplication { public static void main(String[] args) {
SpringApplication.run(HystrixDashboradDemoApplication.class, args);
} } spring.application.name=hystrix-dashboard
server.port=11000

启动就可以访问了: localhost:11000/hystrix就可以看到界面了.

这个时候还没完,因为这个hystrix dashborad是监控,所以必须有服务让他监控,所以需要修改一下服务消费者,添加下面依赖:

<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>

添加注解

@SpringBootApplication
@EnableDiscoveryClient
@EnableFeignClients
@EnableHystrix
public class ServiceConsumerDemoApplication { public static void main(String[] args) {
SpringApplication.run(ServiceConsumerDemoApplication.class, args);
} }

添加配置

server.port=9010
spring.application.name=eureka-service-consumer
eureka.client.service-url.defaultZone=http://localhost:8761/eureka
feign.hystrix.enabled=true
# 用来暴露 endpoints的,如果自身就是监控的话,可以不写(http://www.ityouknow.com/springcloud/2017/05/18/hystrix-dashboard-turbine.html)
management.endpoints.web.exposure.include=hystrix.stream

上面的配置基本就OK了,之后全部启动,访问localhost:11000/hystrix,在第一行输入 http://localhost:9010/actuator/hystrix.stream,点击monitor stream就可以进入监控界面了.

进入监控界面会显示loading,这个是等待你访问,所以这个时候访问localhost:9010/hello/wangzhi,这边监控就会有结果展示了,重点看那6个颜色不同的数字就可以,右边会有说明每个数字表示什么!!!

Turbine

通过 Hystrix Dashboard,我们可以方便的查看服务实例的综合情况,比如:服务调用次数、服务调用延迟等。但是仅通过 Hystrix Dashboard 我们只能实现对服务当个实例的数据展现,在生产环境我们的服务是肯定需要做高可用的,那么对于多实例的情况,我们就需要将这些度量指标数据进行聚合。这个时候就要用到Turbine.

在前面的基础上(也就是前面的系统要启动),重新创建项目turbine-demo,添加依赖等等操作如下

 <dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-turbine</artifactId>
</dependency> spring.application.name=turbine
server.port=11001
eureka.client.service-url.defaultZone=http://localhost:8761/eureka
turbine.app-config==eureka-service-consumer
turbine.cluster-name-expression=new String("default")
turbine.combine-host-port=true @EnableTurbine
@SpringBootApplication
public class TrubineDemoApplication { public static void main(String[] args) {
SpringApplication.run(TrubineDemoApplication.class, args);
} }

配置文件参数说明:

  • turbine.app-config参数指定了需要收集监控信息的服务名;
  • turbine.cluster-name-expression 参数指定了集群名称为 default,当我们服务数量非常多的时候,可以启动多个 Turbine 服务来构建不同的聚合集群,而该参数可以用来区分这些不同的聚合集群,同时该参数值可以在 Hystrix 仪表盘中用来定位不同的聚合集群,只需要在 Hystrix Stream 的 URL 中通过 cluster 参数来指定;
  • turbine.combine-host-port参数设置为true,可以让同一主机上的服务通过主机名与端口号的组合来进行区分,默认情况下会以 host 来区分不同的服务,这会使得在本地调试的时候,本机上的不同服务聚合成一个服务来统计。

这样就可以启动了,直接在浏览器访问localhost:11001/turbin.stream就可以看到效果了.

这就是hystrix的使用和监控面板以及turbine的使用了,两个监控哦.

Spring Cloud(三) --- hystrix的更多相关文章

  1. Spring Cloud中Hystrix、Ribbon及Feign的熔断关系是什么?

    导读 今天和大家聊一聊在Spring Cloud微服务框架实践中,比较核心但是又很容易把人搞得稀里糊涂的一个问题,那就是在Spring Cloud中Hystrix.Ribbon以及Feign它们三者之 ...

  2. Spring Cloud中Hystrix 线程隔离导致ThreadLocal数据丢失问题分析

    最近spring boot项目中由于使用了spring cloud 的hystrix 导致了threadLocal中数据丢失,其实具体也没有使用hystrix,但是显示的把他打开了,导致了此问题. 导 ...

  3. 架构师系列文:通过Spring Cloud组件Hystrix合并请求

    在前文里,我们讲述了通过Hystrix进行容错处理的方式,这里我们将讲述通过Hystrix合并请求的方式 哪怕一个URL请求调用的功能再简单,Web应用服务都至少会开启一个线程来提供服务,换句话说,有 ...

  4. Spring Cloud断路器Hystrix

    在微服务架构中,存在着那么多的服务单元,若一个单元出现故障,就会因依赖关系形成故障蔓延,最终导致整个系统的瘫痪,这样的架构相较传统架构就更加的不稳定.为了解决这样的问题,因此产生了断路器模式. 什么是 ...

  5. Spring Cloud 之 Hystrix.

    一.概述  在微服务架构中,我们将系统拆分成了很多服务单元,各单元的应用间通过服务注册与订阅的方式互相依赖.由于每个单元都在不同的进程中运行,依赖通过远程调用的方式执行,这样就有可能因为网络原因或是依 ...

  6. Spring Cloud之Hystrix

    在微服务架构中,存在那么多的服务单元,若一个单元出现故障(由于网络原因或者自身原因),就很容易因依赖关系而引发故障的蔓延,最终导致整个系统的瘫痪,这样的架构相较传统架构更加不稳定.为了解决这样的问题, ...

  7. 详解Spring Cloud中Hystrix 线程隔离导致ThreadLocal数据丢失

    在Spring Cloud中我们用Hystrix来实现断路器,Zuul中默认是用信号量(Hystrix默认是线程)来进行隔离的,我们可以通过配置使用线程方式隔离. 在使用线程隔离的时候,有个问题是必须 ...

  8. 笔记:Spring Cloud Feign Hystrix 配置

    在 Spring Cloud Feign 中,除了引入了用户客户端负载均衡的 Spring Cloud Ribbon 之外,还引入了服务保护与容错的工具 Hystrix,默认情况下,Spring Cl ...

  9. 从零开始学spring cloud(十一) -------- hystrix监控

    一.官方文档阅读 服务启动后,可以通过/health和hystrix.stream查看效果,实际上,访问上述两个地址,会出现404,这是因为spring boot版本的问题, 我在这里使用的sprin ...

随机推荐

  1. Python3.x:Selenium+PhantomJS爬取带Ajax、Js的网页及获取JS返回值

    前言 现在很多网站的都大量使用JavaScript,或者使用了Ajax技术.这样在网页加载完成后,url虽然不改变但是网页的DOM元素内容却可以动态的变化.如果处理这种网页是还用requests库或者 ...

  2. Java Web应用开发中的一些概念

    最近在学习Java Web,发现Java Web的概念很多,而且各个概念之间的关系也挺复杂,本篇博客把这些关系总结于此,主要参考的博客附在文章末尾. 概念 服务器 服务器,硬件角度上说就是一台高性能的 ...

  3. vue-cli 3.0 axios 跨域请求代理配置及生产环境 baseUrl 配置

    1. 开发环境跨域配置 在 vue.config.js 文件中: module.exports = { runtimeCompiler: true, publicPath: '/', // 设置打包文 ...

  4. 【转载】固态硬盘的S.M.A.R.T详解

    文章来源于: 瑞耐斯存储技术 兵哥写这篇文章,是因为在测试的过程中看到了 SSD存在偶尔有性能下降的情况,经分析为S.M.A.R.T命令所导致,虽然这种情况看似不严重,但如果应用在诸如数据采集等关键性 ...

  5. checkpoint-BLCR部署和测试(源码)

    1. 概述2. 部署过程2.1 源码下载2.2 解压安装2.3 添加库环境2.4 插入内核模块3. 测试3.1 创建测试程序3.2 功能测试4. 参考博客 1. 概述 checkpoint 2. 部署 ...

  6. Mvc_ActionResult返回值

    //ViewResult 表示HTML的页面内容 //EmptyResult 表示空白的页面内容 //RedirectResult 表示定位到另外一个URL //JsonResult 表示可以运用到A ...

  7. 1013 B. And

    链接 [http://codeforces.com/contest/1013/problem/B] 题意 给你一个n和x,再给n个数,有一种操作用x&a[i]取代,a[i],问使其中至少两个数 ...

  8. CodeIgniter 2.x和3.x修改默认控制器问题解答

    首先明确一点,CodeIgniter框架的2.x和3.x版本中修改默认控制器是有一点区别的 但相同的操作都是修改application/config/routes.php $route['defaul ...

  9. sleep、yield、wait、join的区别(阿里面试)

    1.  Thread.sleep(long) 和Thread.yield()都是Thread类的静态方法,在调用的时候都是Thread.sleep(long)/Thread.yield()的方式进行调 ...

  10. PostgreSQL之连接数修改

    当前总共正在使用的连接数 select count(1) from pg_stat_activity; 显示系统允许的最大连接数 show max_connections; 显示系统保留的用户数 sh ...