HDFS的架构

主从结构

主节点，只有一个: namenode
从节点，有很多个: datanodes

在版本1中，主节点只有一个，在版本2中主节点有两个。

namenode 负责(管理)：

接收用户操作请求
维护文件系统的目录结构
管理文件与 block 之间的关系， block 与 datanode 之间关系

block 是文件分成的块， hdfs 中默认的 block 块的大小是64M ，实际的文件肯定会分很多块存储。

datanode 负责(存储)：

存储文件
文件被分成 block 存储在磁盘上
为了保证数据安全，文件会有多个副本

在MapReduce 执行计算任务的时候，计算任务的节点。

Hadoop 在存储文件的时候，文件会有多个副本。

因为 Hadoop 是分布式的存储与计算平台，他使用的是廉价的服务器，廉价的服务器可能会发生故障，如果发生故障了，那么数据就不能用了，

hadoop 为了提高系统的安全性，对数据进行了冗余存储，默认情况下数据的副本是 3. 比如 10G的电影，实际在HDFS中存放的大小不是10G ，而是 30G 。

而在具体数据访问的时候，namenode 会根据不同的 datanode 具体的状况，这种状况包括他的存储空间、繁忙情况、内存等等从三个副本中选出一个副本去使用，另外两个副本就是空闲状态。当这个副本出现问题的时候就会切换到另外一个副本。当然切换回去之后，这个出问题的副本可以得到恢复（与其他副本同步）。

从客户端（java、命令端、其他语言开发的终端….）提交的数据到 namenode , namenode 这时就会看整个集群中的 datanode 中谁属于空闲，谁可用，都会有自己的算法 (关于算法可以从源码的方向上进行理解), 然后确定把数据存储在哪几台机器上，然后这些客户端就会直接和这些 datanodes打交道，把数据直接交给具体的数据节点。当然数据节点在存储数据的过程中，肯定会有一些日志信息(管理与block之间的关系、block与datanode之间的关系)，每一次集群启动的时候，datanode都会把元数据信息（关于 datanode内部怎么组织的）报告给 namenode，这样namenode 才能知道 datanode 具体是怎么组织的然后才能够管理。

HDFS的架构的更多相关文章

初步掌握HDFS的架构及原理
目录 HDFS 是做什么的 HDFS 从何而来为什么选择 HDFS 存储数据 HDFS 如何存储数据 HDFS 如何读取文件 HDFS 如何写入文件 HDFS 副本存放策略 Hadoop2.x新特性 ...
hdfs文件系统架构详解
hdfs文件系统架构详解官方hdfs分布式介绍 NameNode *Namenode负责文件系统的namespace以及客户端文件访问 *NameNode负责文件元数据操作,DataNode负责文件 ...
Hadoop1.x HDFS系统架构
1. HDFS中的一些概念1.1 数据块1.2 NameNode和DataNode1.2.1 管理者:Namenode1.2.1 工作者:Datanode1.3 Secondary Namenode1 ...
hdfs深入：03、hdfs的架构以及副本机制和block块存储
HDFS分布式文件系统设计目标 1. 硬件错误由于集群很多时候由数量众多的廉价机组成,使得硬件错误成为常态 2. 数据流访问所有应用以流的方式访问数 ...
HDFS的架构和设计要点
HDFS的架构和设计要点转大数据之路发布于 2012/10/11 23:00 字数 4487 阅读 495 收藏 1 点赞 0 评论 0 撸了今年阿里.头条和美团的面试,我有一个重要发现.... ...
理解HDFS高可用性架构
在Hadoop1.x版本的时候,Namenode存在着单点失效的问题.如果namenode失效了,那么所有的基于HDFS的客户端——包括MapReduce作业均无法读,写或列文件,因为namenode ...
使用QJM构建HDFS HA架构(2.2+)
转载自:http://blog.csdn.net/a822631129/article/details/51313145 本文主要介绍HDFS HA特性,以及如何使用QJM(Quorum Journa ...
深入理解HDFS的架构和原理
(一) HDFS主要是用于做什么的? HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处 ...
HDFS HA架构以及源代码引导
HA体系架构相关知识介绍 HDFS master/slave架构,HDFS节点分为NameNode节点和DataNode节点. NameNode存有HDFS的元数据:主要由FSImage和EditL ...

随机推荐

【css3笔记】---- 渐变的秘密
<CSS揭秘>这本书非常不错,充满了干货和惊喜.以下主要是关于使用渐变做出来的一些效果的笔记.请用最新的现代浏览器观看. 首先要回顾下一个css语句: linear-gradient([ ...
C#委托使用详解（Delegates）
摘要委托是C#编程一个非常重要的概念,也是一个难点.本文将系统详细讲解委托. 1. 委托是什么? 其实,我一直思考如何讲解委托,才能把委托说得更透彻.说实话,每个人都委托都有不同的见解,因为看问题的 ...
最大子段和（c++）
// 最大子段和.cpp : 定义控制台应用程序的入口点. // #include "stdafx.h" #include<iostream> using namesp ...
windows下配置apache+php环境
PHP安装由于windows下php扩展5.6的多余7.0,故以php5.6为开发环境.如果对扩展要求不高,可以使用php7,安装过程类似. 约定: 环境安装目录: D:/phpsetup/ |-- ...
Vim常用命令
一.插入命令 a 在光标所在字符后插入A 在光标所在行尾插入i 在光标所在字符前插入I 在光标所在行首插入o 在光标下插入新行O 在光标上插入新行二.定位命令 :set nu 设置行号:set no ...
【译】Unity3D Shader 新手教程(3/6) —— 更加真实的积雪
本文为翻译,附上原文链接. 转载请注明出处--polobymulberry-博客园. 如果你满足以下条件,我建议你阅读这篇教程: 你想知道如何在表面着色器中进行混色(blend colour) 你想实 ...
C#中的委托解析
谈及到C#的基本特性,“委托”是不得不去了解和深入分析的一个特性.对于大多数刚入门的程序员谈到“委托”时,都会想到“将方法作为方法的参数进行传递”,很多时候都只是知道简单的定义,主要是因为“委托”在理 ...
2.C#WinForm基础Email分析器
功能:输入Email地址,输出用户名和域名 string[] String.split(params char[] separator)(+5重载)) 返回的字符串数组包含此实例的字符串(由指定Uni ...
Android之图片加载框架Fresco基本使用(二)
PS:最近看到很多人都开始写年终总结了,时间过得飞快,又到年底了,又老了一岁. 学习内容: 1.进度条 2.缩放 3.ControllerBuilder,ControllerListener,Post ...
CentOS7使用firewalld打开关闭防火墙与端口
1.firewalld的基本使用启动: systemctl start firewalld 查看状态: systemctl status firewalld 停止: systemctl disab ...

HDFS的架构

HDFS的架构的更多相关文章

随机推荐

热门专题