RPC 原理的前生今世

　　(如果感觉有帮助，请帮忙点推荐，添加关注，谢谢！你的支持是我不断更新文章的动力。本博客会逐步推出一系列的关于大型网站架构、分布式应用、设计模式、架构模式等方面的系列文章)

　　在校期间大家都写过不少程序，比如写个hello world服务类，然后本地调用下，如下所示。这些程序的特点是服务消费方和服务提供方是本地调用关系。

　　而一旦踏入公司，尤其是大型互联网公司就会发现，公司的系统都由成千上万大大小小的服务组成，各服务部署在不同的机器上，由不同的团队负责。这时就会遇到两个问题：

　　(1) 要搭建一个新服务，免不了需要依赖他人的服务，而现在他人的服务都在远端，怎么调用？

　　(2) 其它团队要使用我们的服务，我们的服务该怎么发布以便他人调用？　　

　　下文我们将对这两个问题展开探讨:
　　public interface HelloWorldService {
　　　　String sayHello(String msg);
　　}

　　public class HelloWorldServiceImpl implements HelloWorldService {
　　　　public String sayHello(String msg) {
　　　　　　String result = "hello world " + msg;
　　　　　　System.out.println(result);
　　　　　　return result;
　　　　}
　　}
　　public class Test {
　　　　public static void main(String[] args) {
　　　　　　HelloWorldService helloWorldService = new HelloWorldServiceImpl();
　　　　　　helloWorldService.sayHello("test");
　　　　}
　　}

一、如何调用他人的远程服务？

　　由于各服务部署在不同的机器上，服务间的调用免不了网络通信过程，服务消费方每调用一个服务都要写一坨网络通信相关的代码，不仅复杂而且极易出错。

　　如果有一种方式能让我们像调用本地服务一样调用远程服务，而让调用者对网络通信这些细节透明，那么将大大提高生产力，比如服务消费方在执行helloWorldService.sayHello(“test”)时，实质上调用的是远端的服务。

　　这种方式其实就是RPC(Remote Procedure Call Protocol)，在各大互联网公司中被广泛使用，如阿里巴巴的hsf、dubbo(开源)、Facebook的thrift(开源)、Google grpc(开源)等。

　　要让网络通信细节对使用者透明，我们自然需要对通信细节进行封装，我们先看下一个RPC调用的流程：

　　a) 服务消费方(client)调用以本地调用方式调用服务；
　　b) client stub接收到调用后负责将方法、参数等组装成能够进行网络传输的消息体；
　　c) client stub找到服务地址，并将消息发送到服务端；
　　d) server stub收到消息后进行解码；
　　e) server stub根据解码结果调用本地的服务；
　　f) 本地服务执行并将结果返回给server stub；
　　g) server stub将返回结果打包成消息并发送至消费方；
　　h) client stub接收到消息，并进行解码；
　　j) 服务消费方得到最终结果。
　　RPC的目标就是要b~h这些步骤都封装起来，让用户对这些细节透明。

二、怎么做到透明化远程服务调用？

　　怎么封装通信细节才能让用户像以本地调用方式调用远程服务呢？对java来说就是使用代理！java代理有两种方式：

　　(1) 动态代理

　　(2) 字节码生成

　　尽管字节码生成方式实现的代理更为强大和高效，但代码不易维护，大部分公司实现RPC框架时还是选择动态代理方式。

　　下面简单介绍下动态代理怎么实现我们的需求。我们需要实现RPCProxyClient代理类，代理类的invoke方法中封装了与远端服务通信的细节，消费方首先从RPCProxyClient获得服务提供方的接口，当执行helloWorldService.sayHello(“test”)方法时就会调用invoke方法。

　　public class RPCProxyClient implements InvocationHandler {
　　　　private Object obj;
　　　　public RPCProxyClient(Object obj){
　　　　　　this.obj=obj;
　　　　}
　　　　//得到被代理对象;
　　　　public static Object getProxy(Object obj){
　　　　　　return java.lang.reflect.Proxy.newProxyInstance(obj.getClass().getClassLoader(), obj.getClass().getInterfaces(), new RPCProxyClient(obj));
　　　　}
　　　　//调用此方法执行
　　　　public Object invoke(Object proxy, Method method, Object[] args) throws Throwable {
　　　　　　//结果参数
　　　　　　Object result = new Object();
　　　　　　// ...执行通信相关逻辑
　　　　　　return result;
　　　　}
　　}
　　public class Test {
　　　　public static void main(String[] args) {
　　　　　　HelloWorldService helloWorldService = (HelloWorldService)RPCProxyClient.getProxy(HelloWorldService.class);
　　　　　　helloWorldService.sayHello("test");
　　　　}
　　}

三、怎么对消息进行编码和解码？

　　上节讲了invoke里需要封装通信细节，而通信的第一步就是要确定客户端和服务端相互通信的消息结构。客户端的请求消息结构一般需要包括以下内容：　　

　　(1) 接口名称
　　　　在我们的例子里接口名是“HelloWorldService”，如果不传，服务端就不知道调用哪个接口了；
　　(2) 方法名
　　　　一个接口内可能有很多方法，如果不传方法名服务端也就不知道调用哪个方法；
　　(3) 参数类型&参数值
　　　　参数类型有很多，比如有bool、int、long、double、string、map、list，甚至如struct(class)；以及相应的参数值；
　　(4) 超时时间　　
　　(5) requestID，标识唯一请求id

　　同理服务端返回的消息结构一般包括以下内容:

　　(1) 返回值

　　(2) 状态code

　　(3) requestID

四、序列化

　　一旦确定了消息的数据结构后，下一步就是要考虑序列化与反序列化了。

　　什么是序列化？序列化就是将数据结构或对象转换成二进制串的过程，也就是编码的过程。

　　什么是反序列化？将在序列化过程中所生成的二进制串转换成数据结构或者对象的过程。

　　为什么需要序列化？转换为二进制串后才好进行网络传输嘛！为什么需要反序列化？将二进制转换为对象才好进行后续处理！

　　现如今序列化的方案越来越多，每种序列化方案都有优点和缺点，它们在设计之初有自己独特的应用场景，那到底选择哪种呢？从RPC的角度上看，主要看三点：

　　(1) 通用性，比如是否能支持Map等复杂的数据结构；

　　(2) 性能，包括时间复杂度和空间复杂度，由于RPC框架将会被公司几乎所有服务使用，如果序列化上能节约一点时间，对整个公司的收益都将非常可观，同理如果序列化上能节约一点内存，网络带宽也能省下不少；

　　(3) 可扩展性，对互联网公司而言，业务变化快，如果序列化协议具有良好的可扩展性，支持自动增加新的业务字段，删除老的字段，而不影响老的服务，这将大大提供系统的健壮性。

　　目前国内各大互联网公司广泛使用hessian、protobuf、thrift、avro等成熟的序列化解决方案来搭建RPC框架，这些都是久经考验的解决方案。

五、通信

　　消息数据结构被序列化为二进制串后，下一步就要进行网络通信了。目前有两种IO通信模型：

　　(1) BIO；

　　(2) NIO。

　　一般RPC框架需要支持这两种IO模型，原理可参考：《一个故事讲清楚 NIO》。

　　如何实现RPC的IO通信框架？

　　(1) 使用java nio方式自研，这种方式较为复杂，而且很有可能出现隐藏bug；

　　(2) 基于mina，mina在早几年比较火热，不过这些年版本更新缓慢；

　　(3) 基于netty，现在很多RPC框架都直接基于netty这一IO通信框架，比如阿里巴巴的HSF、dubbo，Twitter的finagle等。

六、消息里为什么要带有requestID？

　　如果使用netty的话，一般会用channel.writeAndFlush()方法来发送消息二进制串，这个方法调用后对于整个远程调用(从发出请求到接收到结果)来说是一个异步的，即对于当前线程来说，将请求发送出来后，线程就可以往后执行了，至于服务端的结果，是服务端处理完成后，再以消息的形式发送给客户端的。于是这里出现以下两个问题：

　　(1) 怎么让当前线程“暂停”，等结果回来后，再向后执行？

　　(2) 如果有多个线程同时进行远程方法调用，这时建立在client server之间的socket连接上会有很多双方发送的消息传递，前后顺序也可能是随机的，server处理完结果后，将结果消息发送给client，client收到很多消息，怎么知道哪个消息结果是原先哪个线程调用的？

　　如下图所示，线程A和线程B同时向client socket发送请求requestA和requestB，socket先后将requestA和requestB发送至server，而server可能将responseB先返回，尽管requestB请求到达时间更晚。我们需要一种机制保证responseA丢给ThreadA，responseB丢给ThreadB。

　　怎么解决呢？

　　(1) client线程每次通过socket调用一次远程接口前，生成一个唯一的ID，即requestID(requestID必需保证在一个Socket连接里面是唯一的)，一般常常使用AtomicLong从0开始累计数字生成唯一ID；

　　(2) 将处理结果的回调对象callback，存放到全局ConcurrentHashMap里面put(requestID, callback)；

　　(3) 当线程调用channel.writeAndFlush()发送消息后，紧接着执行callback的get()方法试图获取远程返回的结果。在get()内部，则使用synchronized获取回调对象callback的锁，再先检测是否已经获取到结果，如果没有，然后调用callback的wait()方法，释放callback上的锁，让当前线程处于等待状态。

　　(4) 服务端接收到请求并处理后，将response结果(此结果中包含了前面的requestID)发送给客户端，客户端socket连接上专门监听消息的线程收到消息，分析结果，取到requestID，再从前面的ConcurrentHashMap里面get(requestID)，从而找到callback对象，再用synchronized获取callback上的锁，将方法调用结果设置到callback对象里，再调用callback.notifyAll()唤醒前面处于等待状态的线程。　　

　　public Object get() {
　　　　synchronized (this) {　　 // 旋锁
　　　　　　while (!isDone) { 　　 // 是否有结果了
　　　　　　　　wait(); 　　　　　　//没结果是释放锁，让当前线程处于等待状态
　　　　　　}
　　　　}
　　}

　　private void setDone(Response res) {
　　　　this.res = res;
　　　　isDone = true;
　　　　synchronized (this) { 　　// 获取锁，因为前面wait()已经释放了callback的锁了
　　　　　　notifyAll();　　　　 // 唤醒处于等待的线程
　　　　}
　　}

七、如何发布自己的服务？

　　如何让别人使用我们的服务呢？有同学说很简单嘛，告诉使用者服务的IP以及端口就可以了啊。确实是这样，这里问题的关键在于是自动告知还是人肉告知。

　　人肉告知的方式：如果你发现你的服务一台机器不够，要再添加一台，这个时候就要告诉调用者我现在有两个ip了，你们要轮询调用来实现负载均衡；调用者咬咬牙改了，结果某天一台机器挂了，调用者发现服务有一半不可用，他又只能手动修改代码来删除挂掉那台机器的ip。现实生产环境当然不会使用人肉方式。

　　有没有一种方法能实现自动告知，即机器的增添、剔除对调用方透明，调用者不再需要写死服务提供方地址？当然可以，现如今zookeeper被广泛用于实现服务自动注册与发现功能！

　　简单来讲，zookeeper可以充当一个服务注册表(Service Registry)，让多个服务提供者形成一个集群，让服务消费者通过服务注册表获取具体的服务访问地址(ip+端口)去访问具体的服务提供者。如下图所示：

　　具体来说，zookeeper就是个分布式文件系统，每当一个服务提供者部署后都要将自己的服务注册到zookeeper的某一路径上: /{service}/{version}/{ip:port}, 比如我们的HelloWorldService部署到两台机器，那么zookeeper上就会创建两条目录：

　　(1) /HelloWorldService/1.0.0/100.19.20.01:16888

　　(2) /HelloWorldService/1.0.0/100.19.20.02:16888。

　　zookeeper提供了“心跳检测”功能，它会定时向各个服务提供者发送一个请求(实际上建立的是一个 socket 长连接)，如果长期没有响应，服务中心就认为该服务提供者已经“挂了”，并将其剔除，比如100.19.20.02这台机器如果宕机了，那么zookeeper上的路径就会只剩/HelloWorldService/1.0.0/100.19.20.01:16888。

　　服务消费者会去监听相应路径(/HelloWorldService/1.0.0)，一旦路径上的数据有任务变化(增加或减少)，zookeeper都会通知服务消费方服务提供者地址列表已经发生改变，从而进行更新。

　　更为重要的是zookeeper 与生俱来的容错容灾能力(比如leader选举)，可以确保服务注册表的高可用性。

八、小结

　　RPC几乎是每一个从学校进入互联网公司的同学都要首先学习的框架，之前面试过一个在大型互联网公司工作过两年的同学，对RPC还是停留在使用层面，这是不应该的。本文也仅是对RPC的一个比较粗糙的描述，希望对大家有所帮助，错误之处也请指出修正。

RPC 原理的前生今世的更多相关文章

揭秘 BPF map 前生今世
揭秘 BPF map 前生今世本文地址:https://www.ebpf.top/post/map_internal 1. 前言众所周知,map 可用于内核 BPF 程序和用户应用程序之间实现双向 ...
Java NIO 的前生今世之四 NIO Selector 详解
Selector Selector 允许一个单一的线程来操作多个 Channel. 如果我们的应用程序中使用了多个 Channel, 那么使用 Selector 很方便的实现这样的目的, 但是因为在一 ...
月光宝盒之时间魔法--java时间的前生今世
月光宝盒花絮 “曾经有一份真诚的爱情摆在我的面前,但是我没有珍惜,等到了失去的时候才后悔莫及,尘世间最痛苦的事莫过于此.如果可以给我一个机会再来一次的话,我会跟那个女孩子说我爱她,如果非要把这份爱加上 ...
主动降噪技术（ANC）的前生今世--原理仿真
一原理: 主动降噪就是通过反相检测麦克风的声音或噪声来减弱周围环境的噪声让扬声器出来的声音听起来更清晰.主动降噪技术的目标就是通过一个自适应滤波器把不想要的噪声反相从而把噪声约束到固定的范围内.该系 ...
RCNN,Fast RCNN,Faster RCNN 的前生今世：（2）R-CNN
Region CNN(RCNN)可以说是利用深度学习进行目标检测的开山之作.作者Ross Girshick多次在PASCAL VOC的目标检测竞赛中折桂,2010年更带领团队获得终身成就奖,如今供职于 ...
HTML 5 History API的”前生今世”
History是有趣的,不是吗?在之前的HTML版本中,我们对浏览历史记录的操作非常有限.我们可以来回使用可以使用的方法,但这就是一切我们能做的了. 但是,利用HTML 5的History API,我 ...
主动降噪技术（ANC）的前生今世--概念历史
一概念假如使用一句通俗的语言来概述ANC的原理的话,那就是:通过发出与噪声相位相反,频率.振幅相同的声波与噪声干涉实现相位抵消. 使用比较正式的语言来解释就是:动降噪通过降噪系统产生与外界噪音相等 ...
RCNN,Fast RCNN,Faster RCNN 的前生今世：（4） Fast RCNN 算法详解
继2014年的RCNN之后,Ross Girshick在15年推出Fast RCNN,构思精巧,流程更为紧凑,大幅提升了目标检测的速度.在Github上提供了源码. 同样使用最大规模的网络,Fast ...
RCNN,Fast RCNN,Faster RCNN 的前生今世：（2） R- CNN （3，2，1）
3.三次IOU 2.2次model run 1,一次深度神经网络 rcnn主要作用就是用于物体检测,就是首先通过selective search 选择2000个候选区域,这些区域中有我们需要的所对 ...

随机推荐

Nagios全方位告警接入-电话/微信/短信都支持
百度告警平台地址: http://gaojing.baidu.com 联系我们: 邮箱:gaojing@baidu.com 电话:13924600771 QQ群:183806029 Nagios接入 ...
RobotFramework-调用.py文件
RobotFramework-调用.py文件,直接运行: 注意:文件路径的\全部换成好了/
JS 学习笔记--10---基本包装类型
练习中使用的浏览器是IE10,如果有什么错误或者不同意见,希望各位朋友能够指正,练习代码附在后面 1.基本包装类型: 首先是基本类型,但又是特殊的引用类型,因为他们可以调用系统的方法,这种类型就 ...
poj 1113 Wall
题目链接:http://poj.org/problem?id=1113 题目大意:给出点集和一个长度L,要求用最短长度的围墙把所有点集围住,并且围墙每一处距离所有点的距离最少为L,求围墙的长度. 解法 ...
sqlite时间比较语法
如下: 字段 > datetime('2000-01-01 01:01:01') AND 字段 < datetime('2001-01-01 01:01:01');
mongo 1067错误
对mongo进行错误的操作导致mongo服务异常关闭,当重启mongo服务时出现1067错误此时在data目录下产生mongod.lock文件,可以讲此文件删除,然后重启就可以了 Please mak ...
编程计算并输出1～n之间所有素数之和
http://www.tuicool.com/articles/qaaA3i TODO
ios 图片转视频
转自:http://blog.iosxcode4.com/archives/160 用到的FrameWork有: MediaPlayer.framework,QuartzCore.framework, ...
离散-ACM一道强有力的工具
最近几天散搞哭了,都怪以前看到没好好学... 就拿一道题来说事PKU:1151,以前Matrix67写过这道题的BLOG,引用一下: VOJ1056(http://www.vijos.cn/Probl ...
spark分片个数的确定及Spark内存错误(GC error)的迂回解决方式
我们知道,spark中每个分片都代表着一部分数据,那么分片数量如何被确认的呢? 首先我们使用最常见的HDFS+Spark,sparkDeploy的方式来讨论,spark读取HDFS数据使用的是spar ...

RPC 原理的前生今世

RPC 原理的前生今世的更多相关文章

随机推荐

热门专题