Hadoop多节点Cluster

Hadoop多节点集群规划

服务起名称	内网IP	HDFS	YARN
master	192.168.1.155	NameNode	ResourceManager
slave1	192.168.1.116	DataNode	NodeManager
slave2	192.168.1.117	DataNode	NodeManager
slave3	192.168.1.118	DataNode	NodeManager

1. Slave1机器配置
1.1 以单机Hadoop镜像为模板克隆出一个虚拟机, 修改固定IP及MAC地址（修改/etc/sysconfig/network-scripts/ifcfg-ens33)

　　 DEVICE="ens33"
HWADDR="00:0C:29:30:BB:7E"
　　 Type="Ethernet"
　　 BOOTPROTO="static"
　　 IPADDR=192.168.1.156
　　 GATEWAY=192.168.1.1
　　 NETMASK=255.255.255.0
　　 ONBOOT="yes"
1.2 修改机器名为Slave1（/etc/hostname）
1.3 修改机器名及ip映射(/etc/hosts),同时将127.0.0.1映射到slave1

192.168.1.155 master
　　 192.168.1.156 slave1
　　 192.168.1.157 slave2
　　 192.168.1.157 slave3

1.4 编辑/usr/local/hadoop/etc/hadoop/core-site.xml,设置fs.defaultFS值为hdfs://master:9000
1.5 编辑.../..../yarn-site.xml,添加额外的3个property（nodemanager->resourcemanager, application-master->resourcemanager, client->resourcemanager）

　　 <property>
　　　　 <name>yarn.resourcemanager.resource-tracker.address</name>
　　　　 <value>master:8025</value>
　　　 </property>
<property>
　　　　<name>yarn.resourcemanager.scheduler.address</name>
　　　 <value>master:8030</value>
　　 </property>
　　 <property>
　　　　 <name>yarn.resourcemanager.address</name>
　　　　 <value>master:8050</value>
　　 </property>
1.6 编辑mapred-site.xml,添加

<property>
<name>mapred.job.tracker</name>
　　　　 <value>master:54331</value>
　　 </property>
1.7 编辑hdfs-site.xml, slave1为datanode，所以设置data dir

<property>
　　　　 <name>dfs.datanode.data.dir</name>
　　　　 <value>file:/usr/local/hadoop/hadoop_data/hdfs/datanode</value>
　　 </property>

2. Slave2机器配置
2.1 以Slave1机器为模板，复制出新的VM，然后修改固定IP及MAC

　　　DEVICE="ens33"
HWADDR="00:0C:29:51:C4:45"
　　 Type="Ethernet"
　　 BOOTPROTO="static"
　　 PADDR=192.168.1.157
　　 GATEWAY=192.168.1.1
　　 NETMASK=255.255.255.0
　　 ONBOOT="yes"

2.2 修改机器名为Slave2(/etc/hostname)

2.3 修改/etc/hosts，将127.0.0.1映射到slave2

3. Slave3机器配置
3.1 以Slave1机器为模板，复制出新的VM，然后修改固定IP及MAC

　　 DEVICE="ens33"
　　 HWADDR="00:0C:29:BE:C6:0C"
　　 Type="Ethernet"
　　 BOOTPROTO="static"
　　 IPADDR=192.168.1.158
　　 GATEWAY=192.168.1.1
　　 NETMASK=255.255.255.0
　　 ONBOOT="yes"

3.2 修改机器名为Slave3(/etc/hostname)

3.3 修改/etc/hosts，将127.0.0.1映射到slave3

4. Master机器配置
4.1 设置hdfs-site.xml, Master为NameNode, 指定name dir

　　 <property>
　　　　 <name>dfs.namenode.name.dir</name>
　　　　 <value>file:/usr/local/hadoop/hadoop_data/hdfs/namenode</value>
　　 </property>

4.4 设置yarn-site.xml

　　　<property>
　　　　 <name>yarn.resourcemanager.resource-tracker.address</name>
　　　　 <value>master:8025</value>
　　 </property>
　　 <property>
　　　　<name>yarn.resourcemanager.scheduler.address</name>
　　　　 <value>master:8030</value>
　　　</property>
　　 <property>
　　　　 <name>yarn.resourcemanager.address</name>
　　　 <value>master:8050</value>
　　　</property>

4.3 编辑masters(/usr/local/hadoop/etc/hadoop/masters), 内容为master
4.4 编辑slaves(/usr/local/hadoop/etc/hadoop/slaves,内容为
slave1
slave2
slave3
4.5 ssh到3台slaves机器，创建datanode目录/usr/local/hadoop/hadoop_data/hdfs/datanode
4.6 master机器上创建namenode目录/usr/local/hadoop/hadoop_data/hdfs/namenode
4.7 格式化NameNode HDFS目录(hdfs namenode -format)，注意：首次格式化时使用
4.8 启动多节点Hadoop Cluster
start-dfs.sh
start-yarn.sh
4.9 查看ResourceManager Web界面(http://master:8088)及NameNode Web界面(http://master:50070)
4.10 关闭多节点Hadoop Cluster
stop-dfs.sh
stop-yarn.sh

其他：删除多余内网ip命令ip addr del 192.168.1.105/24 dev ens33

Hadoop多节点Cluster的更多相关文章

Hadoop添加节点datanode(生产环境)
Hadoop添加节点datanode 博客分类: hadoop HadoopSSHJDKXML工作 1.部署hadoop 和普通的datanode一样.安装jdk,ssh 2.修改host ...
实验-hadoop新增节点
关于hadoop新增节点网上的说法都有些差别,自己来实践一把 1.建立一个namenode一个datanode的集群 master:192.168.126.130 slave1:192.168.126 ...
Hadoop Datanode节点无法启动（All directories in dfs.data.dir are invalid）
Hadoop Datanode节点无法启动(All directories in dfs.data.dir are invalid) java.io.IOException: All director ...
一、hadoop单节点安装测试
一.hadoop简介相信你或多或少都听过hadoop这个名字,hadoop是一个开源的.分布式软件平台.它主要解决了分布式存储(hdfs)和分布式计算(mapReduce)两个大数据的痛点问题,在h ...
当Hadoop 启动节点Datanode失败解决
Hadoop 启动节点Datanode失败解决 [日期:2014-11-01] 来源:Linux社区作者:shuideyidi [字体:大中小] 当我动态添加一个Hadoop从节点的之后,出现 ...
【Hadoop】Hadoop DataNode节点超时时间设置
hadoop datanode节点超时时间设置 datanode进程死亡或者网络故障造成datanode无法与namenode通信,namenode不会立即把该节点判定为死亡,要经过一段时间,这段时间 ...
【大数据系列】hadoop单节点安装官方文档翻译
Hadoop: Setting up a Single Node Cluster. HADOOP:建立单节点集群 Purpose Prerequisites Supported Platforms R ...
Hadoop多节点集群安装配置
目录: 1.集群部署介绍 1.1 Hadoop简介 1.2 环境说明 1.3 环境配置 1.4 所需软件 2.SSH无密码验证配置 2.1 SSH基本原理和用法 2.2 配置Master无密码登录所有 ...
一步步教你Hadoop多节点集群安装配置
1.集群部署介绍 1.1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台.以Hadoop分布式文件系统HDFS(Hadoop Distributed Filesys ...

随机推荐

vim学习2-文档编辑
一.vim重复命令 1.重复执行上次命令在普通模式下.(小数点)表示重复上一次的命令操作拷贝测试文件到本地目录 $ cp /etc/protocols . 打开文件进行编辑 $ vim proto ...
hdu 4171 最短路
#include<stdio.h> #include<string.h> #include<queue> #include<iostream> usin ...
springCloud学习-分布式配置中心(Spring Cloud Config)
1.简介 Spring Cloud Config :分布式配置中心,方便服务配置文件统一管理,它支持配置服务放在配置服务的内存中(即本地),也支持放在远程Git仓库中.在spring cloud co ...
Grails，应该不错
就当学习英文,也慢慢看看啦..
C. Vladik and Memorable Trip DP
C. Vladik and Memorable Trip time limit per test 2 seconds memory limit per test 256 megabytes input ...
org.hibernate.PropertyValueException: not-null property references a null or transient value: model.
今天在写一个SSH整合的项目时,首先将数据库操作部分单独分离出来,写完后使用Junit进行測试,经过測试.发现没有不论什么问题,对数据库中的内容进行增删改查没有问题,可是将他整合到SSH的项目中时,报 ...
JavaScript的代码库
JavaScript的代码库本文主要是汇集了一些JavaScript中一些经常使用代码.方便以后查找和复用. javascript框架: <script language="java ...
Lucene5学习之使用MMSeg4j分词器
分类:程序语言|标签:C|日期: 2015-05-01 02:00:24 MMSeg4j是一款中文分词器,详细介绍如下: 1.mmseg4j 用 Chih-Hao Tsai 的 MMSeg 算法( ...
Advapi32.dll 函数接口说明
Advapi32.dll 函数接口说明函数原型说明 AbortSystemShutDown ...
浅谈EL与JSTL
讲道理,自己在博大精深的Java世界里还只是一个很小很小的菜鸟.处于成长与学习之中,但学习一个漫长的过程.尤其对于那些知识点我觉得总结是尤为重要的.反正在我看来这段时间里虽然过了很多知识但却是一脸懵逼 ...

Hadoop多节点Cluster

Hadoop多节点Cluster的更多相关文章

随机推荐

热门专题