HDFS Protocol修改流程

相对于1.x版本的Hadoop，2.x版本的Hadoop采用了Protocol Buffer作为序列化反序列化工具，以及RPC通讯工具。这样当我们对Hadoop源码进行修改之前，就需要了解Hadoop 2.x的代码结构和修改方法。

几个结构，以DatanodeProtocol举列子：

DatanodeProtocol.java 还像1.x一样只是一个接口，NameNode继承这一个接口，实现所有功能，但2.x新增了DatanodeProtocolPB.java，DatanodeProtocolClientSideTranslatorPB.java, DatanodeProtocolServerSideTranslatorPB.java三个类。除此之外，还有PB文件,路径在$HADOOP_SOURCE_HOME/hadoop-hdfs-project/hadoop-hdfs/src/main/proto/。maven编译的时候会将相应的类生成到target目录下，并加入CLASSPATH中。

1、DatanodeProtocol.proto

PB文件，定义了message以及service，如果

PB文件，定义了message以及service，如果加入一个接口，需要在其内部定义rpc service。

编辑好后需要通过protoc进行编译，使用maven默认的goal mvn generate-sources即可以。

2、DatanodeProtocolPB.java

3、DatanodeProtocolClientSideTranslatorPB.java

DatanodeProtocol两端Client是DataNode，向NameNode发送RPC请求，Server端是NameNode，接收请求，做出相应的处理，并把结构返回给DataNode。

所以，顾名思义，DatanodeProtocolClientSideTranslatorPB就是在DataNode端将普通的请求，转化为PB格式的请求，发送给NameNode进行处理。

比如：

下面的ReportBadBlocks，就是将pojo的blocks类，转化为PB格式，并通过底层Server类封装好的RPC发送给NameNode。

在DataNode部分，只需要关注逻辑，如红框所示，而不需要关注任何PB的细节，与1.x实现了兼容。

4、DatanodeProtocolServerSideTranslatorPB.java

与DatanodeProtocolClientSideTranslatorPB作用一样，其作用是将序列化为PB格式的类转化为POJO类，调用NameNode实现，并将结果返回给DataNode。

而NameNode部分，只需要将自身实现注册到DatanodeProtocolServerSideTranslatorPB即可。

综上，修改Hadoop2.x的源码需要经过以下几步：

1、需改proto文件，并且通过maven编译

2、需改clientTranslator和serverTranslator部分

3、需改相应的POJO实现类即可

HDFS Protocol修改流程的更多相关文章

HDFS的工作流程
HDFS的工作机制概述 HDFS集群分为两大角色:NameNode.DataNode NameNode负责管理整个文件系统的元数据 DataNode 负责管理用户的文件数据块文件会按照固定的大小( ...
HDFS的工作流程分析
HDFS的工作机制概述 HDFS集群分为两大角色:NameNode.DataNode NameNode负责管理整个文件系统的元数据 DataNode 负责管理用户的文件数据块文件会按照固定的大小( ...
Hive:org.apache.hadoop.hdfs.protocol.NSQuotaExceededException: The NameSpace quota (directories and files) of directory /mydir is exceeded: quota=100000 file count=100001
集群中遇到了文件个数超出限制的错误: 0)昨天晚上spark 任务突然抛出了异常:org.apache.hadoop.hdfs.protocol.NSQuotaExceededException: T ...
robotframework自动化系列：修改流程
在上一小节中,新增流程操作已经完成.那么接下来就是修改的流程操作了,对于一个页面的修改如何操作呢? 针对修改修改操作是在一个已经存在的账号直接修改还是新添加一个账号再修改呢?从用例设计健壮性出发,我们 ...
HDFS读写数据流程
HDFS的组成 1.NameNode:存储文件的元数据,如文件名,文件目录结构,文件属性(创建时间,文件权限,文件大小) 以及每个文件的块列表和块所在的DataNode等.类似于一本书的目录功能. 2 ...
大数据：Hadoop（HDFS 读写数据流程及优缺点）
一.HDFS 写数据流程写的过程: CLIENT(客户端):用来发起读写请求,并拆分文件成多个 Block: NAMENODE:全局的协调和把控所有的请求,提供 Block 存放在 DataNode ...
HDFS04 HDFS的读写流程
HDFS的读写流程(面试重点) 目录 HDFS的读写流程(面试重点) HDFS写数据流程网络拓扑-节点距离计算机架感知(副本存储节点的选择) HDFS的读数据流程 HDFS写数据流程客服端把D: ...
HDFS的读写流程——宏观与微观
HDFS的读写流程--宏观与微观 HDFS:分布式文件系统,负责存放数据分布式文件系统:就是将我们的数据放到多台电脑上存储. 写数据:就是将客户端上的数据上传到HDFS 宏观过程客户端向HDFS发 ...
HDFS文件读写流程
一.HDFS HDFS全称是Hadoop Distributed System.HDFS是为以流的方式存取大文件而设计的.适用于几百MB,GB以及TB,并写一次读多次的场合.而对于低延时数据访问.大量 ...

随机推荐

GNU make 总结 (三)
一.makefile 变量 makefile中的变量名是大小写敏感的,例如”foo”和”Foo”是两个不同的变量.通常情况下,对于一般变量,我们可以使用小写形式,而对于参数变量,采用全大写形式.当我们 ...
Python实现nb(朴素贝叶斯)
Python实现nb(朴素贝叶斯) 运行环境 Pyhton3 numpy科学计算模块计算过程 st=>start: 开始 op1=>operation: 读入数据 op2=>ope ...
28335 sci fifo send
#include "DSP2833x_Device.h"#include "DSP2833x_Examples.h"char buf[]={0x30,0x32, ...
[无人值守安装操作系统]__RHEL6__FTP+TFTP+DHCP+Kickstart+PXE
实验环境 1.实验平台:VMware Workstation 10 2.实验OS:RHEL6 3.服务器A: (1) 10.0.10.158 (2) DHCP/FTP/TFTP (3) 有可使用的yu ...
color the python console text
//install termcolor module cd \ cd python27 cd scripts pip install termcolor pip install colorama // ...
WPF——数据绑定（二）绑定方法—绑定本地对象
注意:本人初学WPF,文中表达或技术性问题请勿见怪,欢迎指正,谢谢标记拓展语法:绑定到本地对象什么是绑定到本地对象,我个人理解就是实现UI层上两个或多个控件的相互关联,一个控件的状态改变,导致另一 ...
【收藏】Linux添加/删除用户和用户组
1.建用户: adduser phpq //新建phpq用户 passwd phpq ...
gitlab&fengoffice的ldap配置
1.fengoffice配置config/ldap_config.php $config_ldap = array ( 'binddn' => 'cn=admin,dc=xxx,dc=xxx', ...
Cash flow
Today,we learn about the cash flow. Cash flow summary: 1.The cash flow identity:(现金恒等式) cash flow fr ...
【Ural】【1519】Formula 1
插头DP 本题为CDQ<基于连通性状态压缩的动态规划的……(我忘了)>里的例题!(嗯就是这样……) 先膜拜一下ccy大神……http://blog.sina.com.cn/s/blog_5 ...

HDFS Protocol修改流程

HDFS Protocol修改流程的更多相关文章

随机推荐

热门专题