Hadoop架构模型

1.hadoop 1.x架构模型：
分布式文件存储系统：HDFS
NameNode（主节点：管理元数据）
secondaryNameNode（作用是合并元数据信息，辅助NameNode管理元数据信息）
DataNode DataNode DataNode（存储数据）
分布式数据计算系统：MapReduce
JobTracker（主节点：负责分配任务）
TaskTracker TaskTracker TaskTracker（负责执行任务）
注：元数据：描述数据的数据。
缺点：单节点故障。

2.hadoop2.x架构模型：
（1）文件存储和数据计算单节点：
分布式文件存储系统：HDFS
NameNode
SecondaryNameNode
DataNode DataNode DataNode
分布式数据计算系统：MapReduce（Yarn资源调度系统）
ResourceManager（主节点：接收用户的任务请求，分配资源给NodeManager）
NodeManager NodeManager NodeManager（执行任务）
ApplicationManager进程：每一个任务请求，ResourceManager都会在某个NodeManager上启动一个APPmaster进程，该APPmaster进程负责向ResourceManager申请资源，并分配任务给每个NodeManager

（2）文件存储高可用，数据计算单节点：略；
（3）文件存储单节点，数据计算高可用：略；
（4）文件存储和数据计算高可用：
分布式文件存储系统：HDFS
JournalNode JournalNode JournalNode（文件系统元数据信息管理，一般都是奇数个）
ZK
NameNode（active状态） NameNode（从节点，standby状态，主要负责监控active何时挂掉，一旦挂掉，立刻接管其工作）
DataNode DataNode DataNode
分布式数据计算系统：MapReduce（Yarn资源调度系统）
ZK
ResourceManager（主节点） ResourceManager（备份节点）
NodeManager NodeManager NodeManager
注：（1）如果NameNode高可用，就没有SecondaryNameNode，取而代之的是JournalNode，其主要用于同步元数据信息，保证2个NameNode的元数据信息一致，并且JournalNode需要奇数个，半数及以上的JournalNode写入元数据成功，就代表写入成功。
（2）两个NameNode组成主备的架构。
（3）集群的脑裂：为了避免集群的脑裂，造成看到的数据不一样，一定要保证两个NameNode中的元数据信息一模一样，而JournalNode就是同步两个NameNode中的元数据信息，保证两者相同。
（4）NameNode高可用的自动切换，主要是通过两个守护进程ZKFC来实现。

Hadoop架构模型的更多相关文章

【Hadoop离线基础总结】Hadoop的架构模型
Hadoop的架构模型 1.x的版本架构模型介绍架构图 HDFS分布式文件存储系统(典型的主从架构) NameNode:集群当中的主节点,主要用于维护集群当中的元数据信息,以及接受用户的请求,处理用 ...
Hadoop架构的初略总结（1）
Hadoop架构的初略总结(1) Hadoop是一个开源的分布式系统基础架构,此架构可以帮助用户可以在不了解分布式底层细节的情况下开发分布式程序. 首先我们要理清楚几个问题. 1.我们为什么需要Had ...
Dubble 01 架构模型&start project
Dubbo 01 架构模型传统架构 All in One 测试麻烦,微小修改全都得重新测单体架构也称之为单体系统或者是单体应用.就是一种把系统中所有的功能.模块耦合在一个应用中的架构方式.其优点 ...
hadoop知识点总结（一）hadoop架构以及mapreduce工作机制
1,为什么需要hadoop 数据分析者面临的问题数据日趋庞大,读写都出现性能瓶颈: 用户的应用和分析结果,对实时性和响应时间要求越来越高: 使用的模型越来越复杂,计算量指数级上升. 期待的解决方案 ...
MFC主窗口架构模型
根据主窗口类型,MFC软件工程可以分为一下几种架构模型: 1.SDI(Simple Document Interface)单文档界面,一个主窗口下只编辑一份文档 2.MDI(Multiple Docu ...
PowerDesigner(三)-企业架构模型（转）
企业架构模型(Enterprise Architecture Model,EAM)是PowerDesigner 15新增的功能,它能够以图形的方式展现企业架构,从而取代文字描述:以偏向非技术性的表达方 ...
PowerDesigner 企业架构模型 ( EAM )
PowerDesigner 企业架构模型 ( EAM ) 说明 file工作数据库框架application网络目录(?)[+] 一. 企业架构模型说明 EnterpriseArchite ...
Unity3D中的AI架构模型
我们都知道现在AI(由人工制造出来的系统所表现出来的模拟人类的智能活动)非常的火,可以说是家喻户晓.当然,在游戏中,AI也是到处可以找到的,对于AI,我们应该关注的问题是如何让游戏角色能够向人或动物那 ...
【深度学习篇】--神经网络中的池化层和CNN架构模型
一.前述本文讲述池化层和经典神经网络中的架构模型. 二.池化Pooling 1.目标降采样subsample,shrink(浓缩),减少计算负荷,减少内存使用,参数数量减少(也可防止过拟合)减少输 ...

随机推荐

CentOS 6 网络设置修改指定IP地址 DNS 网关
环境: 系统硬件:vmware vsphere (CPU:2*4核,内存2G) 系统版本:Centos-6.5-x86_64 路由器网关:192.168.1.1 步骤: 1.查看网络MAC地址 [ro ...
初识Spring Boot框架和快速入门
前面的铺垫文章已经连着写了六篇了,主要是介绍了spring和SpringMVC框架,小伙伴们在学习的过程中大概也发现了这两个框架需要我们手动配置的地方非常多,不过做JavaEE开发的小伙伴们肯定也听说 ...
asp.net mvc5 使用百度ueditor 本编辑器完整示例（上）
最近做一个项目,用到了百度ueditor富文本编辑器,功能强大,在线编辑文档,上传图片\视频.附件. MVC 模型的控制器准备: 1.建立模型. 在项目中Model 文件夹中建立文章模型,注意如果 ...
Vijos P1782 借教室 ( 前缀和&&差分序列）
题目链接:借教室题意:给出n天得教室数目,m个借教室得单子,按顺序借教室,问哪个单子不满足并输出分析:可以用线段树做,会T,常数比较大,选择用差分序列维护前缀和,二分答案即可 #include&l ...
全排列（传统&&黑科技）
近期几次考试的一些题目暴力分都有用到全排列. 全排列是个好东西啊... 回想一下,我们最开始学到全排列是什么时候呢? 大概是学搜索的时候罢... 一.传统搜索算法想复习可以戳 https://www ...
Golang 在 Linux CentOS 6.5 服务器上实现博客后台程序开机启动
在linux下想实现开机启动的方法很多,这里我采用了在/etc/rc.local里写shell指令的方式. 以下就以我的实际操作为例子讲述,很多地方需要看官自己调整信息哦! 1.在/etc/rc.lo ...
c语言程序设计案例教程（第2版）笔记（二）—函数、递归
零散知识点模块化:将一个问题分解成若干个子问题的过程成为模块化. 模块化的优点:不但可以将一个复杂的问题分解成几个相对简单的问题:还可以提高程序代码的重用性. 函数:函数是构成C程序的基本单位.函数 ...
用Python解析HTML，BeautifulSoup使用简介
Beautiful Soup,字面意思是美好的汤,是一个用于解析HTML文件的Python库.主页在http://www.crummy.com/software/BeautifulSoup/ , 下载 ...
[转]访问 OData 服务 (WCF Data Services)
本文转自:http://msdn.microsoft.com/zh-SG/library/dd728283(v=vs.103) WCF 数据服务支持开放式数据协议 (OData) 将数据作为包含可通 ...
AJPFX总结Java 类与对象的初始化
面试的时候,经常会遇到这样的笔试题:给你两个类的代码,它们之间是继承的关系,每个类里只有构造器方法和静态块,它们只包含一些简单的输出字符串到控制台的代码,然后让我们写出正确的输出结果.这实际上是在考察 ...

Hadoop架构模型

Hadoop架构模型的更多相关文章

随机推荐

热门专题