Hadoop2.6.0 完全分布式搭建

1 搭建这个完全分布式的前提环境：

配置好了jdk环境

配置好了ssh免密码登录（详见我的另外一篇博客，专门说ssh免密码登录）

我这里设置了四台机器，一台做master，另外三台做slave，hosts配置如下

192.168.8.94    master

192.168.8.95    slave1

192.168.8.96    slave2

192.168.8.97    slave3

2 hadoop配置(以下的配置只在master上进行，配置好了hadoop之后，再发送到另外三台slave机器上，再配置环境变量就可以了)

首先把hadoop 2.6.0.tar.gz解压到/usr/local目录下

解压命令：sudo tar -xzvf hadoop 2.6.0.tar.gz

然后把解压后的文件夹改名为hadoop

2.1 下面配置环境变量：

配置bashrc，命令 sudo vim ~/.bashrc

配置信息如下图：

修改好了之后，执行source命令生效环境变量，命令 source ~/.bashrc

配置/etc/profile

配置信息如下：

修改好了之后，执行source /etc/profile 命令生效

2.2 配置hadoop的配置文件

所有hadoop的配置文件都在/usr/local/hadoop/etc/hadoop

首先是slaves文件，把所有slave的主机名都写在里面，一行一个，就可以了（注意，要与hosts里配置的名字相一致）

slave1

slave2

slave3

hadoop-env.sh文件

之前这一行是被注释掉的，解除注释后，加上自己的jdk绝对路径。

yarn-env.sh文件，和hadoop-env.sh一样，配置jdk环境变量

core-site.xml 文件

<property>

<name>fs.defaultFS</name>

<value>hdfs://master:9000</value>

</property>

<property>

<name>io.file.buffer.size</name>

<value>131072</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>file:/usr/local/hadoop/tmp</value>

</property>

hdfs-site.xml文件

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>master:9001</value>

</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>file:/usr/local/hadoop/tmp/name</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>file:/usr/local/hadoop/tmp/data</value>

</property>

<property>

<name>dfs.replication</name>

<value>4</value>

</property>

<property>

<name>dfs.webhdfs.enabled</name>

<value>true</value>

</property>

<property>

<name>dfs.permissions</name>

<value>false</value>

</property>

mapred-site.xml

这个配置文件本来是不存在的，但是有一个名为mapred-site.xml.template的模板文件，执行mv mapred-site.xml.template mapred-site.xml复制重命名一份就行了，然后做配置

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

<property>

<name>mapreduce.jobhistory.address</name>

<value>master:10020</value>

</property>

<property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>master:19888</value>

</property>

yarn-site.xml文件

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>               
<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<property>

<name>yarn.resourcemanager.address</name>

<value>master:8032</value>

</property>

<property>             
<name>yarn.resourcemanager.scheduler.address</name>

<value>master:8030</value>

</property>

<property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>master:8031</value>

</property>

<property>

<name>yarn.resourcemanager.admin.address</name>

<value>master:8033</value>

</property>

<property>                 
<name>yarn.resourcemanager.webapp.address</name>

<value>master:8088</value>

</property>

这样，hadoop的所有配置就做好了。

然后再把这个/usr/local/hadoop文件分别发送给另外三个slave，执行如下命令即可，不过要在目标文件夹设置好读写权限

比如在slave1上设置读写权限，在/usr/local目录下执行如下命令即可

sudo chown -R hadoop ./

其中hadoop是我的用户名，./表示当前目录

然后再master机器上执行如下命令就可以把hadoop文件发送到slave1上了，slave2和3方法相同

scp -r /usr/local/hadoop hadoop@slave1:/usr/local/

3 发送过去之后修改slave中几个配置文件

首先就是像master一样配置环境变量，前边写了，不赘述了。然后修改core-site.xml文件dfs.datanode.data.dir这一项，如下

<property>

<name>dfs.datanode.data.dir</name>

<value>file:/usr/local/hadoop/tmp/data/node1</value>

</property>

在data后边又添加了一个目录叫node1，在slave2上添加的就叫nade2，以此类推，不这样配置会检测不出当前存在的某些虚拟机。

以上就完成了，然后就是通过命令启动master上的hadoop，slave上的某些进程就会启动，就ok了。

Hadoop2.6.0 完全分布式搭建的更多相关文章

hadoop2.2.0伪分布式搭建3--安装Hadoop
3.1上传hadoop安装包 3.2解压hadoop安装包 mkdir /cloud #解压到/cloud/目录下 tar -zxvf hadoop-2.2.0.tar.gz -C /cloud/ 3 ...
hadoop2.2.0伪分布式搭建
1.准备Linux环境 1.0点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ...
Hadoop2.6.0伪分布式搭建
环境: 1.Ubuntu14.04 首先要在linux系统上新建一个账户,比如就叫做hadoop,用于专门运行hadoop. 2.配置jdk 我是使用的版本是jdk1.8. 解压:创建/usr/jav ...
hadoop2.4.0伪分布式搭建以及分布式关机重启后datanode没起来的解决办法
1.准备Linux环境 1.0点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip ...
hadoop2.2.0伪分布式搭建1--准备Linux环境
1.0修改网关点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip 设置网段:19 ...
hadoop2.2.0伪分布式搭建2--安装JDK
2.1上传FileZilla 上传 https://filezilla-project.org/ 2.2解压jdk #创建文件夹 mkdir /usr/java #解压 tar -zxvf jdk-7 ...
Hadoop2.5.0伪分布式环境搭建
本章主要介绍下在Linux系统下的Hadoop2.5.0伪分布式环境搭建步骤.首先要搭建Hadoop伪分布式环境,需要完成一些前置依赖工作,包括创建用户.安装JDK.关闭防火墙等. 一.创建hadoo ...
在Win7虚拟机下搭建Hadoop2.6.0伪分布式环境
近几年大数据越来越火热.由于工作需要以及个人兴趣,最近开始学习大数据相关技术.学习过程中的一些经验教训希望能通过博文沉淀下来,与网友分享讨论,作为个人备忘. 第一篇,在win7虚拟机下搭建hadoop ...
bayaim_hadoop1_2.2.0伪分布式搭建
------------------bayaim_hadoop1_2.2.0伪分布式搭建_2018年11月06日09:21:46--------------------------------- 1. ...

随机推荐

CALayer层的属性(转)
一.position和anchorPoint 1.简单介绍 CALayer有2个非常重要的属性:position和anchorPoint position: (1)用来设置CALayer在父层中的 ...
[Git add . ] 遇到The file will have its original line endings in your working directory 解决办法
1.在新项目中使用[ git add . ]时出现: warning: LF will be replaced by CRLF in ...... The file will have its ori ...
CentOS7 minimal 没有netstat命令
在CentOS 7 minimal中使用netstat 时,发现显示如下,明显没有了netstat 命令 [root@localhost ~]# netstat -a -bash: netstat: ...
【acl-访问控制列表】
配置acl访问控制列表{ firewall enable:开启路由器防火墙功能 fire default {permit || deny}:设置防火墙的默认行为: acl number[2000,29 ...
ELK的简述安装
一.ElasticSearch集群的安装及其配置 https://www.cnblogs.com/gentle-awen/p/10000801.html 可视化x-pack安装: https://ww ...
hadoop生态搭建（3节点）-07.hive配置
# http://archive.apache.org/dist/hive/hive-2.1.1/ # ================================================ ...
Mysql通过Adjacency List(邻接表)存储树形结构
转载自:https://www.jb51.net/article/130222.htm 以下内容给大家介绍了MYSQL通过Adjacency List (邻接表)来存储树形结构的过程介绍和解决办法,并 ...
RedHat安装Oracle后中文乱码
radhat7.1 Oracle11gr2 安装Oracle时忘记设置字符集,导致安装后中文乱码,中文变成"???????????" 分析原因是Oracle服务器端和客户端的字符集 ...
20145202 《网络对抗技术》 PC平台逆向破解
20145202 <网络对抗技术> PC平台逆向破解准备工作先将环境设置为:堆栈可执行.地址随机化关闭参考http://git.oschina.net/wildlinux/NetSe ...
fsync体会
看这个链接:http://www.postgresql.org/docs/9.1/static/runtime-config-wal.html 是这样说的: fsync (boolean) If th ...

Hadoop2.6.0 完全分布式搭建

Hadoop2.6.0 完全分布式搭建的更多相关文章

随机推荐

热门专题