Hadoop架构模型
1.hadoop 1.x架构模型:
分布式文件存储系统:HDFS
NameNode(主节点:管理元数据)
secondaryNameNode(作用是合并元数据信息,辅助NameNode管理元数据信息)
DataNode DataNode DataNode(存储数据)
分布式数据计算系统:MapReduce
JobTracker(主节点:负责分配任务)
TaskTracker TaskTracker TaskTracker(负责执行任务)
注:元数据:描述数据的数据。
缺点:单节点故障。
2.hadoop2.x架构模型:
(1)文件存储和数据计算单节点:
分布式文件存储系统:HDFS
NameNode
SecondaryNameNode
DataNode DataNode DataNode
分布式数据计算系统:MapReduce(Yarn资源调度系统)
ResourceManager(主节点:接收用户的任务请求,分配资源给NodeManager)
NodeManager NodeManager NodeManager(执行任务)
ApplicationManager进程:每一个任务请求,ResourceManager都会在某个NodeManager上启动一个APPmaster进程,该APPmaster进程负责向ResourceManager申请资源,并分配任务给每个NodeManager
(2)文件存储高可用,数据计算单节点:略;
(3)文件存储单节点,数据计算高可用:略;
(4)文件存储和数据计算高可用:
分布式文件存储系统:HDFS
JournalNode JournalNode JournalNode(文件系统元数据信息管理,一般都是奇数个)
ZK
NameNode(active状态) NameNode(从节点,standby状态,主要负责监控active何时挂掉,一旦挂掉,立刻接管其工作)
DataNode DataNode DataNode
分布式数据计算系统:MapReduce(Yarn资源调度系统)
ZK
ResourceManager(主节点) ResourceManager(备份节点)
NodeManager NodeManager NodeManager
注:(1)如果NameNode高可用,就没有SecondaryNameNode,取而代之的是JournalNode,其主要用于同步元数据信息,保证2个NameNode的元数据信息一致,并且JournalNode需要奇数个,半数及以上的JournalNode写入元数据成功,就代表写入成功。
(2)两个NameNode组成主备的架构。
(3)集群的脑裂:为了避免集群的脑裂,造成看到的数据不一样,一定要保证两个NameNode中的元数据信息一模一样,而JournalNode就是同步两个NameNode中的元数据信息,保证两者相同。
(4)NameNode高可用的自动切换,主要是通过两个守护进程ZKFC来实现。
Hadoop架构模型的更多相关文章
- 【Hadoop离线基础总结】Hadoop的架构模型
Hadoop的架构模型 1.x的版本架构模型介绍 架构图 HDFS分布式文件存储系统(典型的主从架构) NameNode:集群当中的主节点,主要用于维护集群当中的元数据信息,以及接受用户的请求,处理用 ...
- Hadoop架构的初略总结(1)
Hadoop架构的初略总结(1) Hadoop是一个开源的分布式系统基础架构,此架构可以帮助用户可以在不了解分布式底层细节的情况下开发分布式程序. 首先我们要理清楚几个问题. 1.我们为什么需要Had ...
- Dubble 01 架构模型&start project
Dubbo 01 架构模型 传统架构 All in One 测试麻烦,微小修改 全都得重新测 单体架构也称之为单体系统或者是单体应用.就是一种把系统中所有的功能.模块耦合在一个应用中的架构方式.其优点 ...
- hadoop知识点总结(一)hadoop架构以及mapreduce工作机制
1,为什么需要hadoop 数据分析者面临的问题 数据日趋庞大,读写都出现性能瓶颈: 用户的应用和分析结果,对实时性和响应时间要求越来越高: 使用的模型越来越复杂,计算量指数级上升. 期待的解决方案 ...
- MFC主窗口架构模型
根据主窗口类型,MFC软件工程可以分为一下几种架构模型: 1.SDI(Simple Document Interface)单文档界面,一个主窗口下只编辑一份文档 2.MDI(Multiple Docu ...
- PowerDesigner(三)-企业架构模型(转)
企业架构模型(Enterprise Architecture Model,EAM)是PowerDesigner 15新增的功能,它能够以图形的方式展现企业架构,从而取代文字描述:以偏向非技术性的表达方 ...
- PowerDesigner 企业架构模型 ( EAM )
PowerDesigner 企业架构模型 ( EAM ) 说明 file工作数据库框架application网络 目录(?)[+] 一. 企业架构模型 说明 EnterpriseArchite ...
- Unity3D中的AI架构模型
我们都知道现在AI(由人工制造出来的系统所表现出来的模拟人类的智能活动)非常的火,可以说是家喻户晓.当然,在游戏中,AI也是到处可以找到的,对于AI,我们应该关注的问题是如何让游戏角色能够向人或动物那 ...
- 【深度学习篇】--神经网络中的池化层和CNN架构模型
一.前述 本文讲述池化层和经典神经网络中的架构模型. 二.池化Pooling 1.目标 降采样subsample,shrink(浓缩),减少计算负荷,减少内存使用,参数数量减少(也可防止过拟合)减少输 ...
随机推荐
- Consistent Hashing算法
前几天看了一下Memcached,看到Memcached的分布式算法时,知道了一种Consistent Hashing的哈希算法,上网搜了一下,大致了解了一下这个算法,做下记录. 数据均衡分布技术在分 ...
- 客户端与服务器持续同步解析(轮询,comet,WebSocket)
在B/S模型的Web应用中,客户端常常需要保持和服务器的持续更新.这种对及时性要求比较高的应用比如:股票价格的查询,实时的商品价格,自动更新的twitter timeline以及基于浏览器的聊天系统( ...
- 《JAVA与模式》之迭代子模式
迭代子模式又叫游标(Cursor)模式,是对象的行为模式.迭代子模式可以顺序地访问一个聚集中的元素而不必暴露聚集的内部表象(internal representation). 聚集和JAVA聚集 多个 ...
- r.json()
requests模块中,r.json()为Requests中内置的JSON解码器 其中只有response返回为json格式时,用r.json()打印出响应的内容, 如果response返回不为jso ...
- redis info 参数说明
原文: redis info 参数说明 redis 127.0.0.1:6381> info redis_version:2.4.16 # Redis 的版本redis_git_sha1:000 ...
- bzoj 4195: [Noi2015]程序自动分析【并查集】
等于有传递性,所以hash一下把等于用并查集连起来,然后再判断不等于是否合法即可 #include<iostream> #include<cstdio> #include< ...
- Luogu P1119 灾后重建 【floyd】By cellur925
题目传送门 这道题我们很容易想到对于每次询问,都跑一遍最短路(spfa,虽然他已经死了).只需在松弛的时候加入当前相关的点是否已经修好的判断,果不其然的TLE了4个点. (然鹅我第一次用spfa跑的时 ...
- Luogu P3916 图的遍历 【优雅的dfs】【内有待填坑】By cellur925
说明 • 对于60% 的数据, n,m在1e3内 • 对于100% 的数据, n,m在1e5内. 本弱弱上来就是一顿暴搜打,dfs n次,每次更新答案,复杂度为O(n*n),果然TLE,60分抱回家. ...
- 依赖注入(二)Autofac简单使用
Autofac简单使用 源码下载传上源码,终于学会传文件了. 首先 还是那句话:“不要信我,否则你死得很惨!”. C#常见的依赖注入容器 IoC in .NET part 1: Autofac IoC ...
- shiro之SimpleAccountRealm
我使用的是maven构建的工程,junit测试 Shiro认证过程 创建SecurityManager--->主体提交认证--->SecurityManager认证--->Authe ...