1.hadoop 1.x架构模型:
分布式文件存储系统:HDFS
NameNode(主节点:管理元数据)
secondaryNameNode(作用是合并元数据信息,辅助NameNode管理元数据信息)
DataNode DataNode DataNode(存储数据)
分布式数据计算系统:MapReduce
JobTracker(主节点:负责分配任务)
TaskTracker TaskTracker TaskTracker(负责执行任务)
注:元数据:描述数据的数据。
缺点:单节点故障。

2.hadoop2.x架构模型:
(1)文件存储和数据计算单节点:
分布式文件存储系统:HDFS
NameNode
SecondaryNameNode
DataNode DataNode DataNode
分布式数据计算系统:MapReduce(Yarn资源调度系统)
ResourceManager(主节点:接收用户的任务请求,分配资源给NodeManager)
NodeManager NodeManager NodeManager(执行任务)
ApplicationManager进程:每一个任务请求,ResourceManager都会在某个NodeManager上启动一个APPmaster进程,该APPmaster进程负责向ResourceManager申请资源,并分配任务给每个NodeManager

(2)文件存储高可用,数据计算单节点:略;
(3)文件存储单节点,数据计算高可用:略;
(4)文件存储和数据计算高可用:
分布式文件存储系统:HDFS
JournalNode JournalNode JournalNode(文件系统元数据信息管理,一般都是奇数个)
ZK
NameNode(active状态) NameNode(从节点,standby状态,主要负责监控active何时挂掉,一旦挂掉,立刻接管其工作)
DataNode DataNode DataNode
分布式数据计算系统:MapReduce(Yarn资源调度系统)
ZK
ResourceManager(主节点) ResourceManager(备份节点)
NodeManager NodeManager NodeManager
注:(1)如果NameNode高可用,就没有SecondaryNameNode,取而代之的是JournalNode,其主要用于同步元数据信息,保证2个NameNode的元数据信息一致,并且JournalNode需要奇数个,半数及以上的JournalNode写入元数据成功,就代表写入成功。
(2)两个NameNode组成主备的架构。
(3)集群的脑裂:为了避免集群的脑裂,造成看到的数据不一样,一定要保证两个NameNode中的元数据信息一模一样,而JournalNode就是同步两个NameNode中的元数据信息,保证两者相同。
(4)NameNode高可用的自动切换,主要是通过两个守护进程ZKFC来实现。

Hadoop架构模型的更多相关文章

  1. 【Hadoop离线基础总结】Hadoop的架构模型

    Hadoop的架构模型 1.x的版本架构模型介绍 架构图 HDFS分布式文件存储系统(典型的主从架构) NameNode:集群当中的主节点,主要用于维护集群当中的元数据信息,以及接受用户的请求,处理用 ...

  2. Hadoop架构的初略总结(1)

    Hadoop架构的初略总结(1) Hadoop是一个开源的分布式系统基础架构,此架构可以帮助用户可以在不了解分布式底层细节的情况下开发分布式程序. 首先我们要理清楚几个问题. 1.我们为什么需要Had ...

  3. Dubble 01 架构模型&start project

    Dubbo 01 架构模型 传统架构 All in One 测试麻烦,微小修改 全都得重新测 单体架构也称之为单体系统或者是单体应用.就是一种把系统中所有的功能.模块耦合在一个应用中的架构方式.其优点 ...

  4. hadoop知识点总结(一)hadoop架构以及mapreduce工作机制

    1,为什么需要hadoop 数据分析者面临的问题 数据日趋庞大,读写都出现性能瓶颈: 用户的应用和分析结果,对实时性和响应时间要求越来越高: 使用的模型越来越复杂,计算量指数级上升. 期待的解决方案 ...

  5. MFC主窗口架构模型

    根据主窗口类型,MFC软件工程可以分为一下几种架构模型: 1.SDI(Simple Document Interface)单文档界面,一个主窗口下只编辑一份文档 2.MDI(Multiple Docu ...

  6. PowerDesigner(三)-企业架构模型(转)

    企业架构模型(Enterprise Architecture Model,EAM)是PowerDesigner 15新增的功能,它能够以图形的方式展现企业架构,从而取代文字描述:以偏向非技术性的表达方 ...

  7. PowerDesigner 企业架构模型 ( EAM )

    PowerDesigner 企业架构模型 ( EAM ) 说明 file工作数据库框架application网络   目录(?)[+]   一. 企业架构模型 说明 EnterpriseArchite ...

  8. Unity3D中的AI架构模型

    我们都知道现在AI(由人工制造出来的系统所表现出来的模拟人类的智能活动)非常的火,可以说是家喻户晓.当然,在游戏中,AI也是到处可以找到的,对于AI,我们应该关注的问题是如何让游戏角色能够向人或动物那 ...

  9. 【深度学习篇】--神经网络中的池化层和CNN架构模型

    一.前述 本文讲述池化层和经典神经网络中的架构模型. 二.池化Pooling 1.目标 降采样subsample,shrink(浓缩),减少计算负荷,减少内存使用,参数数量减少(也可防止过拟合)减少输 ...

随机推荐

  1. bzoj 3809 Gty的二逼妹子序列 —— 莫队+分块

    题目:https://www.lydsy.com/JudgeOnline/problem.php?id=3809 据说一开始应该想到莫队+树状数组,然而我想的却是莫队+权值线段树... 如果用权值线段 ...

  2. 【194】Windows 上使用 wget

    本文包括两部分,首先就是在 Windows 使用 wget 来下载文件,这样固然很好,然而问题并非这么简单,在 PowerShell 4.0 版本中增加了 Invoke-WebRequest 的别名 ...

  3. PowerShell+NetApi 批处理执行程序

    基于CMD 编写批处理程序很反人类,此篇文章介绍利用Power Shell脚本(借鉴明经net版主雪山飞狐的脚本改造而成)处理之前的Bat+scr的过程(https://www.cnblogs.com ...

  4. Quartz.Net实现的定时执行任务调度

    在之前的文章<推荐一个简单.轻量.功能非常强大的C#/ASP.NET定时任务执行管理器组件–FluentScheduler>和<简单.轻量.功能非常强大的C#/ASP.NET定时调度 ...

  5. IEEE Trans 2006 使用K-SVD构造超完备字典以进行稀疏表示(稀疏分解)

    K-SVD可以看做K-means的一种泛化形式,K-means算法总每个信号量只能用一个原子来近似表示,而K-SVD中每个信号是用多个原子的线性组合来表示的.    K-SVD算法总体来说可以分成两步 ...

  6. 【洛谷4769】[NOI2018] 冒泡排序(动态规划_组合数学)

    题目: 洛谷 4769 博客页面左下角的嘴嘴瓜封神之战中的题目 分析: 一个排列交换次数为 \(\frac{1}{2}\sum_{i=1}^{n}|i-p_i|\) 的充要条件是这个排列不存在长度为 ...

  7. d3学习笔记

    (1)使用enter()函数. 当要创建新的绑定数据的元素,必须使用enter().这个方法会分析当前选择的DOM元素和传给它的数据,如果数据值比对应的DOM元素多,就创建一个新的占位元素.然后把这个 ...

  8. Lync客户端证书安装

    安装完Lync客户端后,运行时Lync客户端时,报出如下错误: [原因解析] Lync客户端没有正确安装CA证书链. [解决办法] 第一种方法:将计算机加入域. 第二种方法:不加入域的处理方法: 1. ...

  9. 【图片匹配】--- SIFT_Opencv3.1.0_C++_ubuntu

    最近在捣鼓图片相似性匹配算法.这里先说一点必要的题外话: 如果是在同一个object不同角度拍摄的多张图片中,使用SIFT可以有不错的效果: 如果是寻找类别相同的图片(可能不是同一object),SI ...

  10. AJPFX关于代码块的总结

    代码块:        {                执行语句;        }(1) 当出现在局部位置时, 为局部代码块.        局部位置: 如语句块中, 函数中, 构造代码块中, 静 ...