HDFS pipeline写 -- datanode

站在DataNode的视角，看看pipeline写的流程，本文不分析客户端部分，从客户端写数据之前拿到了3个可写的block位置说起。

每个datanode会创建一个线程DataXceiverServer，接收上游过来的TCP连接，对于每个新建的TCP连接,都会创建一个叫做DataXceiver的线程处理这个连接. 这个线程不断的从TCP连接中读op，然后调用processOp(op)处理这个op，这里以write block 这个op为例.

对于datanode来说，write block操作由DataXceiver的writeBlock函数实现.

大体步骤如下：

new 一个BlockReceiver对象，随后用于接收上游(client或者datanode)的block数据.
根据传进来的DatanodeInfo数组，向数组的第一个元素代表的datanode建立TCP连接,targets参数是从上游的TCP连接中解析出来的，逻辑在Receiver的opWriteBlock方法中，Receiver是DataXceiver的基类.然后调用Sender的writeBlock方法给下游datanode发送write block相关元信息，包括DatanodeInfo数组(刨去第一个元素)，clientname,block的当前gs,minBytesRcvd,maxBytesRcvd(对于append,recovery操作有用)等。然后读取下游的回复封装在BlockOpResponseProto对象中，可以通过内部成员firstBadLink知道建pipeline中第一个失败的datanode节点。接着将BlockOpResponseProto回复给上游
(datanode或者client)，最后调用第一步new的BlockReceiver的receiveBlock方法用于接收一个完整的block.如下：

receiveBlock内部根据clientname发现是一个客户端在写block，创建一个PacketResponder线程用于处理下游datanode对packet的ack.PacketResponder后面分析。接着，不断的调用receivePacket()方法从上游(datanode或者client)接收一个个的packet，接收一个完整的packet的逻辑是由内部的PacketReceiver来处理的.
对于一个接收到的packet，写入block file文件，同时checksum信息写meta文件，然后放入PacketResponder的ack queue队列，然后将packet写给下游的datanode。最后调用PacketResponder的 close方法，这个方法会等到ack queue为空，即所有packet都已经从下游收到，并且已经给上游ack.
receiveBlock()结束后，关掉和上下游的连接.

清空ack queue的逻辑由专门处理下游ack包的PacketResponder线程处理,逻辑如下：

如果datanode是pipeline的中间node（通过PacketResponder的type属性来决定，LAST_IN_PIPELINE和HAS_DOWNSTREAM_IN_PIPELINE）,
那么从下游读一个PipelineAck，从ack中拿到seqno，然后从ack queue中get(不删除)第一个packet，拿出seqno，记作expected_seq_no，然后比较是否相等，如果不相等，说明写出错. 如果seqno相同，往下.
如果从ack queue中get的packet是block的最后一个packet，说明一个block接收完成.那么调用finalizeBlock方法.finalizeBlock方法逻辑如下：

关闭block file和meta file文件，调用FsDatasetImpl的finalizeBlock(block)将block文件以及对应的meta文件移动到对应的block pool下的finalized目录下，然后生成一个FinalizedReplica对象，将bpid->FinalizedReplica的映射关系记录在内存中的volumnMap中,对象位于FsDatasetImpl下的ReplicaMap volumnMap(从ReplicaMap中定位一个ReplicaInfo，需要拿着bpid和block id去找)最后调用datanode的closeBlock()方法,将block回报给namenode,该方法逻辑如下：

拿着block的bpid从BlockPoolManager中拿到相应的BPOfferService，通知namenode这个block。在data node这边，data node和每个namenode的接口由一
个BPServiceActor来承担，这是一个线程, 这个线程会向namenode汇报received block或者指示namenode去删除block.最后调用DatanodeProtocolClientSideTranslatorPB bpNamenode的blockReceivedAndDeleted()将block信息汇报上去.
给从下游接收的ack回复给上游。
将packet从ack queue的头部删除。

可以看出，一个block的写操作对于每个data node来说，由两个线程参与，一个是DataXceiver，用于接收上游的数据，一个是PacketResponder，用于处理下游回来的ack。还没有接收到下游的ack并且没有给上游回复ack的packet都存在在ack queue中。

参考资料

hadoop-hdfs-2.4.1.jar

HDFS pipeline写 -- datanode的更多相关文章

HDFS pipeline写 -- 客户端
上一篇说了datanode端如何处理pipeline写请求的,这里主要看DFSClient. 这里以append为例, write差不多. 创建一个pipeline用于append操作的流程: Fil ...
HDFS dfsclient写文件过程源码分析
HDFS写入文件的重要概念 HDFS一个文件由多个block构成.HDFS在进行block读写的时候是以packet(默认每个packet为64K)为单位进行的.每一个packet由若干个chunk( ...
HDFS的写数据过程分析
HDFS的写数据过程分析我们通过FileSystem类可以操控HDFS, 那我们就从这里开始分析写数据到HDFS的过程. 在我们向 HDFS 写文件的时候,调用的是 FileSystem.creat ...
Linux启动kettle及linux和windows中kettle往hdfs中写数据(3)
在xmanager中的xshell运行进入图形化界面 sh spoon.sh 新建一个job
hadoop之解析HDFS的写文件流程
文件是如何写入HDFS的 ? 下面我们来先看看下面的“写”流程图: 假如我们有一个文件test.txt,想要把它放到Hadoop上,执行如下命令: 引用 # hadoop fs - ...
hdfs webhdfs 写文件(create file)
# _*_ coding=utf-8 _*_ import sys import os hosts = {} cmd1 = ''' curl -i -X PUT "http://%s:500 ...
HDFS 读/写数据流程
1. HDFS 写数据流程客户端通过 Distributed FileSystem 模块向 NameNode 请求上传文件, NameNode 检查目标文件是否已存在,父目录是否存在: NameNo ...
HDFS数据节点DataNode未启动解决方法
在解决这个问题的过程中,我又是积累了不少经验... 首先让我搞了很久的问题是,书上说进程全部启动的命令是/bin/start-all.sh,但是当我执行的时候显示command not found.后 ...
HDFS 手写mapreduce单词计数框架
一.数据处理类 package com.css.hdfs; import java.io.BufferedReader; import java.io.IOException; import java ...

随机推荐

SPSS学习系列之SPSS Modeler怎么修改默认的内存大小（图文详解）
不多说,直接上干货! 问题来源: 如果你的电脑内存配置比较低的话,会随着数据量增加(尤其是大数据),带不起的情况很有可能发生,会出现一些内存报错... ... 解决办法: 打开“工具”,在modele ...
centos中软件源码简单的编译安装./configure,make ,make install
参考 Linux下源码编译安装详解源码编译安装分三个步骤 1. 编译参数配置 2. 编译 3. 安装 1. 源码编译安装环境检查以及编译参数配置编译器在开始工作之前,需要知道当前的系统环境,比如标 ...
jQuery为图片添加链接(创建新的元素来包裹选中的元素)
主要用到 wrap()函数 http://www.w3school.com.cn/jquery/manipulation_wrap.asp 这个函数是创建新的的元素去包裹所执行这个方法的元素如下例子 ...
OOAD之面向对象设计原则
学习这个设计模式真的觉得很抽象,只有自己多多的领会! 在很多时候,很多的知识都会觉得讲起来是很矛盾的. 本章目标 1 掌握内聚度和耦合度的概念 2 掌握面向对象设计原则 (一)如何衡量软件设计的质 ...
cgroups简单使用
Cgroups控制系统资源的分配(cpu.mem.io) 1.cgroups概述 CGroup是Linux内核提供的可以限制.隔离进程组 (process groups) 所使用的物理资源 (如 cp ...
python性能对比
python性能对比之items #1 #-*- coding:utf8-*- import datetime road_nodes = {} for i in range(5000000): roa ...
vue cli+axios踩坑记录+拦截器使用，代理跨域proxy
1.首先axios不支持vue.use()方式声明使用,看了所有近乎相同的axios文档都没有提到这一点建议方式在main.js中如下声明使用 import axios from 'axios'; ...
[学习笔记] Miller-Rabin质数测试 & Pollard-Rho质因数分解
目录 Miller-Rabin质数测试 & Pollard-Rho质因数分解 Miller-Rabin质数测试一些依赖的定理实现以及正确率 Pollard-Rho质因数分解生日悖论与生日 ...
JAVA-7NIO之Socket/ServerSocket Channel
一.ServerSocketChannel Java NIO中的 ServerSocketChannel 是一个可以监听新进来的TCP连接的通道, 就像标准IO中的ServerSocket一样.Ser ...
基于python的多线程暴破脚本
搭建了一个本地wordpress,写一个基于多线程异步I/O的暴力破解 1 测试提交错误的表单数据时,查看请求参数登录时发送的cookie 2 登录分析经过多次测试,发现无论是输入正确的密码还是 ...

HDFS pipeline写 -- datanode

参考资料

HDFS pipeline写 -- datanode的更多相关文章

随机推荐

热门专题