1. 前言 1

2. Hadoop RPC 1

2.1. 总体结构 1

2.1.1. RPC Interface 1

2.1.2. RPC Server 1

2.1.3. RPC Client 1

2.2. RPC Interface 2

2.2.1. getServer 2

2.2.2. getProxy 3

2.3. RPC Server 4

2.3.1. RPC Server结构 4

2.3.1.1. Server 4

2.3.1.2. RPC.Server 4

2.3.1.3. Server.Listener 4

2.3.1.4. Server.Handler 5

2.3.1.5. Server.Responder 5

2.3.1.6. Server.Connection 5

2.3.1.7. Server.Call 5

2.3.2. RPC Server主要流程 5

2.3.2.1. 接收Call调用 5

2.3.2.2. 处理Call调用 6

2.4. RPC Client 8

2.4.1. RPC Client结构 8

2.4.1.1. Client 8

2.4.1.2. Client.ConnectionId 8

2.4.1.3. Client.Call 8

2.4.1.4. Client.ParallelResults 8

2.4.1.5. RPC.Invoker 9

2.4.1.6. RPC.Invocation 9

2.4.2. RPC Client主要流程 9

2.4.2.1. Call流程 9

2.4.2.2. getConnection流程 10

2.5. RPC线程关系 11

1. 
前言

本文主要是介绍Hadoop RPC子系统的关键模块的结构和流程。

2. Hadoop RPC

2.1. 总体结构

HadoopRPC逻辑上分成三部分,如上图所示。

2.1.1. RPC Interface

RPC对外接口。

2.1.2. RPC Server

RPC服务端的实现。

2.1.3. RPC Client

RPC客户端的实现。

2.2. RPC Interface

RPC是对外的接口类,主要提供两个方法:getProxy和getServer。

2.2.1. getServer

Ø 说明

RPC服务端接口。为指定协议的实例,在指定的地址和端口上启动服务。

Ø 函数原型

public static Server getServer(

final Object instance,

final String bindAddress,

final int port,

final int numHandlers,

final boolean verbose,

Configuration conf) throws IOException;

Ø 参数说明

1) Instance

RPC Server端对象实例,也就是RPC Client调用的接口实例。

2) bindAddress

RPC Server监听的IP地址。

3) Port

RPC Server监听的端口号。

4) numHandlers

处理Call队列的Handler线程个数。

5) Verbose

6) conf

配置项。

2.2.2. getProxy

Ø 说明

RPC客户端接口,创建一个指定服务端的代理。

Ø 函数原型

public static VersionedProtocol getProxy(

Class<? extends VersionedProtocol> protocol,

long clientVersion,

InetSocketAddress addr,

UserGroupInformation ticket,

Configuration conf,

SocketFactory factory) throws IOException;

Ø 参数说明

1) protocol

RPC Server提供RPC服务的接口。

2) clientVersion

客户端的版本号。

3) addr

RPC Server地址。

4) ticket

5) conf

配置项。

6) factory

SOCKET工厂。

2.3. RPC Server

2.3.1. RPC Server结构

2.3.1.1. Server

抽象的RPC服务,提供Call队列。

2.3.1.2. RPC.Server

Server的实现。

2.3.1.3. Server.Listener

RPC服务端的监听者,用来接受RPC客户端的连接请求和数据的收发。

2.3.1.4. Server.Handler

RPC服务端的Call处理者,和Server.Listener通过Call队列交互。

2.3.1.5. Server.Responder

RPC服务端的响应者。Server.Handler向RPC客户端发送响应是异步非阻塞的,如果有未发送出的数据,交由Server.Responder来完成。

2.3.1.6. Server.Connection

提供接收数据,解析数据包的功能。

2.3.1.7. Server.Call

持有客户端的Call信息。

2.3.2. RPC Server主要流程

2.3.2.1. 接收Call调用

接收RPC Client的调用,并编码成Call对象,放入到Call队列中,这个过程在Listener线程中完成。

Ø 步骤说明:

1) Listener线程循环等待RPC客户端的发送数据过来

2) 当有数据可以接收时,调用Connection的readAndProcess方法

3) Connection边接收边对数据进行处理,如果接收到一个完整的Call包,则构建一个Call对象,并将这个Call对象PUSH到Call队列中,由Handler线程来处理Call队列中的所有Call。

2.3.2.2. 处理Call调用

处理Call队列中的每个请求,在Handler线程中完成。

Ø 步骤说明:

1) Handler线程循环监听Call队列,如果Call队列为空,则进入wait状态,否则按FIFO规则从Call队列取出Call

2) 将Call交给RPC.Server处理(调用RPC.Server的Call)

3) 借助JDK提供的Method,完成对目标方法的调用

4) 返回响应。由于响应需要通过SOCKET返回给RPC客户端,所以响应的类型必须是Writable。

2.4. RPC Client

2.4.1. RPC Client结构

2.4.1.1. Client

RPC客户端的实现和入口类。

2.4.1.2. Client.ConnectionId

到RPC服务端对象连接的标识。

2.4.1.3. Client.Call

存储Call调用信息。

2.4.1.4. Client.ParallelResults

存储响应。

2.4.1.5. RPC.Invoker

对InvocationHandler的实现,提供invoke方法,截获RPC客户端对RPC服务端对象的调用。

2.4.1.6. RPC.Invocation

用来序列化和反序列化RPC客户端的调用信息,包括方法名和参数信息。

2.4.2. RPC Client主要流程

2.4.2.1. Call流程

客户端RPC调用的处理流程,转化为SOCKET通信。

Ø 步骤说明:

1) RPC客户端发起一个RPC调用时,JAVA的反射机制会截获该调用,并转化为对Client.call的调用

2) 调用getConnection建立到RPC服务端的连接

3) 通过Connection将序列化后的参数发送到RPC服务端

4) 等待RPC服务端返回响应。

2.4.2.2. getConnection流程

该流程用来建立到RPC Server端的连接,到一个RPC Server端只会建立一个连接。

Ø 步骤说明:

1) 根据RPC服务端的地址和接口从连接池中获取一个,如果取到Connection则直接返回

2) 否则新建一个Connection,并将它放入到连接池中

3) 然后通过SocketFactory创建一个Socket,并建立到RPC服务端的连接,如果连接不成功,则重试

4) 创建和关联输入和输出流对象。

2.5. RPC线程关系

客户端发起的RPC调用都是同步的,而服务端处理RPC调用是异步的。客户端调用线程以阻塞同步的方式发起RPC连接,及RPC调用,将参数等信息发送给Listener,然后就等待Connection接收完响应返回。

Listener负责接收RPC连接,和RPC数据,当一个Call的数据接收完后,组装成Call,并将Call放入由Handler提供的Call队列中。

Handler线程一直监听Call队列,如果Call队列不为空,则按队列方式取出一个Call,并转为实际调用,以非阻塞方式将响应发回给Connection,剩下未发送完毕的响应交给Responder处理。

Haodoop RPC解析的更多相关文章

  1. RPC服务框架dubbo(一):简介和原理解析

    前置概念 在学习dubbo前,需要先了解SOA和RPC这两个概念. SOA 1.英文名称(Service Oriented Ambiguity) 2.中文名称:面向服务架构 2.1 有一个专门提供服务 ...

  2. dubbo入门学习

    官方网址:http://dubbo.apache.org/zh-cn/index.html 学习可以参考官网中文文档:http://dubbo.apache.org/zh-cn/docs/user/q ...

  3. DUBBO学习心得

     项目环境版本:dubbo2.5.10 spring版本4.3.10  一 SOA 1英文名称(Service Oriented Ambiguity) 2 中文名称:面向服务架构 2.1 有一个专门提 ...

  4. RPC 的概念模型与实现解析

    今天分布式应用.云计算.微服务大行其道,作为其技术基石之一的 RPC 你了解多少?一篇 RPC 的技术总结文章,数了下 5k+ 字,略长,可能也不适合休闲的碎片化时间阅读,可以先收藏抽空再细读:) 全 ...

  5. Hadoop源码解析之 rpc通信 client到server通信

    rpc是Hadoop分布式底层通信的基础,无论是client和namenode,namenode和datanode,以及yarn新框架之间的通信模式等等都是采用的rpc方式. 下面我们来概要分析一下H ...

  6. RPC 的概念模型与实现解析(转)

    今天分布式应用.云计算.微服务大行其道,作为其技术基石之一的 RPC 你了解多少?一篇 RPC 的技术总结文章,数了下 5k+ 字,略长,可能也不适合休闲的碎片化时间阅读,可以先收藏抽空再细读:) 全 ...

  7. RPC原理解析

    1.RPC原理解析 1.1 什么是RPC RPC(Remote Procedure Call Protocol) --远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络 ...

  8. OpenStack RPC框架解析

    1  消息队列Rabbitmq介绍 Rabbitmq的整体架构图 (1)Rabbitmq Server:中间那部分就是Rabbitmq Server,也叫broken server,主要是负责消息的传 ...

  9. JAVA RPC (九) netty服务端解析

    源码地址:https://gitee.com/a1234567891/koalas-rpc 企业生产级百亿日PV高可用可拓展的RPC框架.理论上并发数量接近服务器带宽,客户端采用thrift协议,服务 ...

随机推荐

  1. SIM800/SIM900/SIM7000/SIM7600底层操作接口_句柄方式完全分离通信底层

    使用SIMCOM公司通信模块将底层的通信与应用完全进行了分离,便于移植. SIMCOM.h //定义了相关的结构体与类型. SIMCOM_AT.c//定义了底层的AT接口 SIMCOM_GSM.c// ...

  2. Redis队列——PHP操作简单示例

    入队操作 <?php $redis = new Redis(); $redis->connect('127.0.0.1',6379); while(True){ try{ $value = ...

  3. 黄聪:VS2010编辑C#未启动,打开设计视图时报"未将对象引用设置到对象的实例"

    通常情况下,若是你将用户控件写好了放入窗体中,若是有不合理的代码,则会弹出错误提示框,不让你放.若是你之前只是随便加了一个用户控件,并且没有什么问题,但后来你又把控件改坏掉了,那么你打开就会报错(在窗 ...

  4. [转]Spring 之 Log4j 的配置

  5. java之序列化与反序列化

    1.这里主要是介绍Protobuf提供的序列化与反序列化的高效性.相对于传统的java提供的序列化来说,Protobuf的效率提高了很多倍.但是也有不足的地方,就是proto在对象序列化的时候抛弃了很 ...

  6. MOBA游戏的网络同步技术

    转自:http://www.gameres.com/750888.html 在5月13日Unite 2017 案例分享专场上,蓝港互动<闹闹天宫>项目组的主程序陈实分享了MOBA游戏的网络 ...

  7. 爬虫之requests与bautifullSoup

    requests Python标准库中提供了:urllib.urllib2.httplib等模块以供Http请求,但是,它的 API 太渣了.它是为另一个时代.另一个互联网所创建的.它需要巨量的工作, ...

  8. python mysql模块

    多次使用python操作mysql数据库,先与大家分享一下,关于如何使用python操作mysql数据库.mysql并不是python自带的模块,因此需要下载安装.(在windows平台下介绍该使用过 ...

  9. PackedSyncPtr

    folly/PackedSyncPtr.h A highly specialized data structure consisting of a pointer, a 1-bit spin lock ...

  10. urllib2模块的基本使用(四)

    urllib2库的基本使用 所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地. 在Python中有很多库可以用来抓取网页,我们先学习urllib2. urllib2 是 P ...