分布式RPC框架Dubbo实现服务治理:集成Kryo实现高速序列化,集成Hystrix实现熔断器
Dubbo+Kryo实现高速序列化
- Dubbo RPC是Dubbo体系中最核心的一种高性能,高吞吐量的远程调用方式,是一种多路复用的TCP长连接调用:
- 长连接: 避免每次调用新建TCP连接,提高调用的响应速度
- 多路复用: 单个TCP连接可交替传输多个请求和响应的消息,降低了连接的等待时间,从而减少了同样并发数的情况下网络连接数,提高了系统的云吞吐量
- Dubbo RPC主要用于两个Dubbo之间的远程调用,适合高并发,小数据的互联网场景.序列化对于远程调用的响应速度,吞吐量,网络带宽消耗等同样也起着至关重要的作用,是提升分布式系统性能的最关键因素之一
- Dubbo中支持的序列化方式:
- dubbo序列化: 阿里的高效java序列化实现
- hessian2序列化: hessian是一种高效跨语言的二进制序列化方式.这里不是原生的hessian2序列化,而是阿里修改过的hessian lite,是Dubbo RPC默认启动的序列化方式
- json序列化: 目前有两种实现-
- 采用阿里的fastjson库
- 采用dubbo中实现的简单json库
- json这种文本序列化性能不如dubbo序列化,hessian2序列化这两种二进制序列化
- java序列化: 主要采用JDK自带的Java序列化实现,性能差
- 序列化方式:
- 针对Java语言的序列化方式:Kryo,FST
- 跨语言的序列化方式:Protostuff,ProtoBuf,Thrift,Avro,MsgPack
序列化:
1.序列化(serialization)在计算机科学的资料处理中,是指将数据结构或物件状态转换成可取用格式(例如存成档案,存于缓冲,或经由网络中传送),
以留待后续在相同或另一台计算机环境中,能恢复原先状态的过程。依照序列化格式重新获取字节的结果时,
可以利用它来产生与原始物件相同语义的副本。
2.简单的来讲就是将某种数据结构或者对象转换成一种数据格式,数据格式可以通过网络传送或者存入数据库中,
同时可以根据数据格式还原出原来的数据结构(反序列化)。在 Java 中,对象只有在 JVM 运行时才会存在,如果想要把对象存储到本地或者发送到远程的服务器,
则必须通过序列化将对象转换成相应的字节然后进行存储或者传送,之后再将字节组装成对象。
3.在以下场景中都会遇到序列化:
3.1将对象状态保存到文件或者数据库中
3.2通过 socket 在网络中传送对象
3.3通过RMI(远程方法调用)传输对象
- 在面向生产的环境中,使用Dubbo+Kryo实现序列化:
- 引入Kryo依赖kryo-serializers
<dependency>
<groupId>de.javakaffee</groupId>
<artifactId>kryo-serializers</artifactId>
<version>0.42</version>
</dependency>
- 配置文件中增加配置
dubbo.protocol. serialization=kryo
- 注册被序列化类
- 要让Kryo发挥高性能,需要将需要被序列化的实体类注册到Dubbo系统中,实现如下回调接口:
public class SerializationOptimizerImpl implements SerializationOptimizerImpl{
public Collection<class> getSerializableClasses(){
List<Class> classes=new LinkedList<class>();
classes.add(provider.class);
classes.add(consumer.class);
return classes;
}
}
- 配置文件中增加配置
dubbo.protocol.optimizer=com.oxford.SerializationOptimizerImpl
- 注册这些类后,序列化的性能大大提升,特别是针对小数量的嵌套对象
1.为什么需要手动注册,不在配置文件中注册?
因为要注册的类往往数量较多,导致配置文件冗长
在没有好的IDE支持下,配置文件的编写和重构都比Java类复杂得多
这些注册的类一般是不需要在项目编译打包后还需要动态修改的
2.为什么不用@annotation标注然后系统发现并注册?
因为annotation只能用来标注你可以修改的类,很多序列化的类是无法修改的(第三方库,JDK系统和其它项目的类)
3.除了annotation,可以用其它方式来自动注册被序列化的类,如扫描路径,自动发现实现
Serializable接口(甚至包括Externalizable)的类并注册,类路径上找到Serializable类可能非常多,
可以用package前缀来一定程度限定扫描范围
在自动注册机制中,要保证服务提供端和消费端以同样的顺序(或者ID)来注册类,避免错位.因为可
被发现然后注册的类的数量可能都是不一样的
- 注意:(无参构造函数和Serializable接口)
- 如果被序列化的类,不包含无参构造函数,则会导致Kryo序列化性能降低.因为底层将会使用Java的序列化来透明取代Kryo序列化.尽可能为每一个被序列化的类添加无参构造函数(Java类如果不自定义构造函数,默认就有无参构造函数)
- Kryo和FST都不需要被序列化类实现Serializable接口,但还是需要每个序列化类都去实现Serializable接口,保持和Java序列化以及dubbo序列化兼容性
Dubbo+Hystrix实现服务熔断
- 熔断器:
- 在微服务架构中,根据业务拆分成一个个的服务,服务服务之间通过RPC相互调用
- 为了保证高可用,单个服务采用集群部署,由于网络或者自身的原因,服务不能保证100%可用
- 如果单个服务出现问题,调用这个服务就会出现出现线程阻塞,此时若大量的请求涌入,servlet容器的线程就会被消耗完毕,导致服务瘫痪,服务与服务之间的依赖性会导致故障传播,进而导致整个微服务瘫痪,这就是"服务雪崩效应"
- 为了解决服务雪崩效应,提出熔断器的模型
- 熔断器模型:
- 底层的服务出现故障,会导致连锁故障
- 当对特定服务调用的不可用到达一个阈值(Hystrix默认5秒20次),熔断器就会被打开
- 熔断器打开后,为了避免连锁故障,通过fallback方法直接返回一个固定值
Dubbo Provider中使用熔断器
- 在Provider(服务提供者)中增加依赖spring-cloud-starter-netflix-hystrix
- 在主类中标注@EnableHystrix注解
- 在接口实现类的服务调用方法上标注@HystrixCommand注解,调用Hystrix代理
可以在@HystrixCommand中的@HystrixProperty中配置阈值
Dubbo Consumer中使用熔断器
- 在Consumer(服务消费者)中增加依赖spring-cloud-starter-netflix-hystrix
- 在主类上标注@EnableHystrix注解
- 在调用类controller中的调用方法上标注 @HystrixCommand(fallback="熔断返回页面的方法名")
Dubbo+Hystrix熔断器仪表盘
在Provider和Consumer中都需要配置Hystrix仪表盘,配置方式一致
Dubbo+Hystrix配置熔断器仪表盘
- 增加Hystrix仪表盘依赖spring-cloud-starter-netflix-hystrix-dashboard
- 在主类上标注@EnableHystrixDashboard注解开启Hystrix仪表盘功能
- 创建hystrix.stream(监控路径)的Servlet配置
@Configuration
public class HystrixDashBoardConfiguration{
@Bean
public ServletRegistrationBean getServlet(){
HystrixMetricsStreamServlet streamServlet=new HystrixMetricsStreamServlet();
ServletRegistrationBean registrationBean=new ServletRegistrationBean(streamServlet);
registrationBean.setLoadOnStartup(1);
registrationBean.addUrlMappings("/hystrix.stream");
registrationBea.setName("HystrixMetricsStreamServlet");
return registrationBean;
}
}
Hystrix说明
触发fallback方法
| 参数 | 描述 |
|---|---|
| FAILURE | 执行抛出异常 |
| TIMEOUT | 执行开始,但没有在指定的时间内完成 |
| SHORT_CIRCUITED | 断路器打开,不尝试执行 |
| THREAD_POOL_REJECTED | 线程池拒绝,不尝试执行 |
| SEMAPHORE_REJECTED | 信号量拒绝,不尝试执行 |
fallback方法抛出异常
| 参数 | 描述 |
|---|---|
| FALLBACK_FAILURE | Fallback执行抛出出错 |
| FALLBACK_REJECTED | Fallback信号量拒绝,不尝试执行 |
| FallBack_MISSING | 没有Fallback实例 |
Hystrix常用配置信息
超时时间(默认1000ms)
- hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds: 在Consumer中配置,Provider的所有方法的超时时间都是该值,优先级低于下面的指定配置
- hystrix.command.HystrixCommandKey.execution.isolation.thread.timeoutInMilliseconds: 在Consumer中配置,Provider的指定方法(HystrixCommandKey方法名)的超时时间都是该值
线程池核心线程数
- hystrix.threadpool.default.coreSize: 默认为10,Consumer中配置
- Queue:
- hystrix.threadpool.default.maxQueueSize: 最大排队长度,默认-1,使用 SynchronousQueue, 其他值使用LinkedBlockingQueue. 如果要从-1换成其他值重启,即该值不能动态调整,需要使用下边这个配置
- hystrix.threadpool.default.queueSizeRejectionThreshold: 排队线程数量阈值,默认为5,达到时拒绝,如果配置了该选项,队列的大小是该队列(注意: 如果maxQueueSize=-1的话,则该选项不起作用)
断路器
- hystrix.command.default.circuitBreaker.requestVolume.Threshold: 当在配置时间窗口内达到此数量的失败后,进行短路,默认20个
- hystrix.command.default.circuitBreaker.sleepWindowinMilliseconds: 短路一定的时间开始尝试是否恢复,默认5s
- hystrix.command.default.circuitBreaker.errorThresholdPercentage: 出错百分比阈值,当达到此阈值后,开始短路,默认50%
fallback
- hystrix.command.default.fallback.isloation.semaphore.maxConcurrentRequests: 调用线程(Consumer)允许请求HystrixCommand.GetFallback()最大数量,默认为10.(注意: 该项配置对于THREAD隔离模式也生效)
分布式RPC框架Dubbo实现服务治理:集成Kryo实现高速序列化,集成Hystrix实现熔断器的更多相关文章
- 阿里 RPC 框架 DUBBO 初体验
最近研究了一下阿里开源的分布式RPC框架dubbo,楼主写了一个 demo,体验了一下dubbo的功能. 快速开始 实际上,dubbo的官方文档已经提供了如何使用这个RPC框架example代码,基于 ...
- RPC 框架 Dubbo 从理解到使用(一)
技术架构演变 单一应用架构 通俗地讲,"单体应用(monolith application)"就是将应用程序的所有功能都打包成一个独立的单元.当网站流量很小时,只需一个应用,将所有 ...
- RPC 框架 Dubbo 从理解到使用(二)
本篇文章为系列文章,未读第一集的同学请猛戳这里:RPC 框架 Dubbo 从理解到使用(一) 本篇文章讲解 Dubbo 支持的注册中心.Dubbo 负载均衡策略和 Dubbo 控制台的安装. 注册中心 ...
- 一个轻量级分布式RPC框架--NettyRpc
1.背景 最近在搜索Netty和Zookeeper方面的文章时,看到了这篇文章<轻量级分布式 RPC 框架>,作者用Zookeeper.Netty和Spring写了一个轻量级的分布式RPC ...
- 轻量级分布式RPC框架
随笔- 139 文章- 0 评论- 387 一个轻量级分布式RPC框架--NettyRpc 1.背景 最近在搜索Netty和Zookeeper方面的文章时,看到了这篇文章<轻量级分布式 ...
- 一个轻量级分布式 RPC 框架 — NettyRpc
原文出处: 阿凡卢 1.背景 最近在搜索Netty和Zookeeper方面的文章时,看到了这篇文章<轻量级分布式 RPC 框架>,作者用Zookeeper.Netty和Spring写了一个 ...
- 轻量级分布式 RPC 框架
@import url(/css/cuteeditor.css); 源码地址:http://git.oschina.net/huangyong/rpc RPC,即 Remote Procedure C ...
- 【转】轻量级分布式 RPC 框架
第一步:编写服务接口 第二步:编写服务接口的实现类 第三步:配置服务端 第四步:启动服务器并发布服务 第五步:实现服务注册 第六步:实现 RPC 服务器 第七步:配置客户端 第八步:实现服务发现 第九 ...
- 轻量级分布式 RPC 框架(转)
RPC,即 Remote Procedure Call(远程过程调用),说得通俗一点就是:调用远程计算机上的服务,就像调用本地服务一样. RPC 可基于 HTTP 或 TCP 协议,Web Servi ...
随机推荐
- 想了很久,一道Microsoft的笔试题目 —— Reversing Linked List
Reversing Linked List Given a constant K and a singly linked list L, you are supposed to reverse the ...
- Webpack 5 配置手册(从0开始)
针对新手入门搭建项目,Webpack5 配置手册(从0开始) webpack安装顺序 1. `npm init -y`,初始化包管理文件 package.json 2. 新建src源代码目录 3. 新 ...
- 【JVM进阶之路】八:性能监控工具-命令行篇
定位问题的时候,知识.经验是关键基础,数据是依据,工具是运用知识处理数据的手段. 在实际的故障排查.性能监控中,常常是操作系统的工具和Java虚拟机的工具结合使用. 1.操作系统工具 1.1.top: ...
- 使用KeepAlived来实现高可用的DR模型
环境 VMware 16 CentOS8 相关软件 keepalived ipvsadm httpd 准备工作 准备四个节点,如上图,Node01 ~ Node04, 本文默认你会在VMWare上安装 ...
- 全网最详细的Linux命令系列-cd命令
Linux cd 命令可以说是Linux中最基本的命令语句,其他的命令语句要进行操作,都是建立在使用 cd 命令上的. 所以,学习Linux 常用命令,首先就要学好 cd 命令的使用方法技巧. 命令格 ...
- java面试-强引用、软引用、弱引用和幻象引用有什么区别
在Java语言中,除了基本数据类型外,其他的都是指向各类对象的对象引用:Java中根据其生命周期的长短,将引用分为4类. 不同的引用类型,主要体现的是对象不同的可达性状态和对垃圾收集的影响. 1 .强 ...
- 关于MySQL日志,我与阿里P9都聊了些啥?
写在前面 周末,我与阿里P9资深技术专家(这里就不说名字了),聊起了MySQL这个话题,为啥会聊这个呢?因为他看到我出版了一部<MySQL技术大全:开发.优化与运维实战>,对书籍的评价也是 ...
- IDEA 配置文件位置
1 IDEA 2020.1 以上 1.1 Win 语法: %APPDATA%\JetBrains\<product><version> Win上的APPDATA默认位置如下: ...
- 扩展 GRTN:云原生趋势下的 RTC 架构演进
在 2021 LiveVideoStackCon 音视频技术大会上海站,聚焦 "轻端重云和边缘架构新模式" 专场,阿里云视频云的 RTC 传输专家杨成立(忘篱)带来 "基 ...
- CSS快速入门基础篇,让你快速上手(附带代码案例)
1.什么是CSS 学习思路 CSS是什么 怎么去用CSS(快速上手) CSS选择器(难点也是重点) 网页美化(文字,阴影,超链接,列表,渐变等) 盒子模型 浮动 定位 网页动画(特效效果) 项目格式: ...