原创hadoop2.6集群环境搭建

三台机器： Hmaster 172.168.2.3、Hslave1 172.168.2.4、Hslave2 172.168.2.6

JDK：1.8.49

OS：red hat 5.4 64 （由于后期发现有一些由于系统lib库版本太低、python版本太低、java运行环境版本太低等问题，降低了搭建效率，应该用至少是7及以上的OS版本。尤其是无法使用本地库的问题必须得由升级操作系统很多组件来解决，如glib库等）

1、配置hostname /etc/system/network

域名映射 /etc/hosts 每个机器都有3条映射信息

2、增加用户hadoop，设置三台机器间免密通信

ssh-keygen -t rsa

cat id_rsa.pub >> authorized_keys

scp id_rsa.pub hadoop@172.168.2.4:~/.ssh/id_rsa.pub_sl

scp id_rsa.pub hadoop@172.168.2.6:~/.ssh/id_rsa.pub_sl

cat id_rsa.pub_sl >> authorized_keys

chmod 700 ~/.ssh
chmod 600 ~/.ssh/authorized_keys

3、升级JDK

rpm -ivh jdk-8u91-linux-x64.rpm

vi .bash_profile

export JAVA_HOME=/usr/java/jdk1.8.0_91

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export PATH=$JAVA_HOME/bin:$PATH

export HADOOP_HOME=/home/hadoop/hadoop-2.6.4/

4、配置

三个节点都创建这三个文件夹

[hadoop@Hmaster ~]$ mkdir -p hadoop/tmp

[hadoop@Hmaster ~]$ mkdir -p dfs/data

[hadoop@Hmaster ~]$ mkdir -p dfs/name

主要涉及的配置文件有7个：都在/hadoop/etc/hadoop文件夹下，可以用gedit命令对其进行编辑。

~/hadoop/etc/hadoop/hadoop-env.sh -->修改JAVA_HOME
~/hadoop/etc/hadoop/yarn-env.sh -->修改JAVA_HOME
~/hadoop/etc/hadoop/slaves -->>增加slave节点
~/hadoop/etc/hadoop/core-site.xml -->>增加hadoop核心配置
~/hadoop/etc/hadoop/hdfs-site.xml -->>增加hdfs配置信息（namenode、datanode端口和目录位置）
~/hadoop/etc/hadoop/mapred-site.xml -->>增加mapreduce配置（使用yarn框架、jobhistory使用地址以及web地址）

~/hadoop/etc/hadoop/yarn-site.xml -->>增加resource manager

[hadoop@Hmaster ~]$ cd /home/hadoop/hadoop-2.6.4/etc/hadoop/

vi hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1.8.0_91

vi yarn-env.sh

JAVA_HOME=/usr/java/jdk1.8.0_91

vi core-site.xml

<name>hadoop.tmp.dir</name>

<value>/home/hadoop/hadoop/tmp</value>

<description>Abase for other temporary directories.</description>

</property>

<name>fs.defaultFS</name>

<value>hdfs://Hmaster:9000</value>

</property>

<name>io.file.buffer.size</name>

</property>

</configuration>

vi hdfs-site.xml

<name>dfs.namenode.name.dir</name>

<value>file:///home/hadoop/dfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:///home/hadoop/dfs/data</value>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.namenode.secondary.http-address</name>

<value>Hmaster:50090</value>

</property>

</configuration>

vi mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobtracker.http.address</name>

<value>Hmaster:50030</value>

</property>

<name>mapreduce.jobhistory.address</name>

<value>Hmaster:10020</value>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>Hmaster:19888</value>

</property>

<name>mapred.job.tracker</name>

<value>http://Hmaster:9001</value>

</property>

</configuration>

vi yarn-site.xml

<name>yarn.resourcemanager.hostname</name>

<value>Hmaster</value>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.resourcemanager.address</name>

<value>Hmaster:8032</value>

</property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>Hmaster:8030</value>

</property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>Hmaster:8031</value>

</property>

<name>yarn.resourcemanager.admin.address</name>

<value>Hmaster:8033</value>

</property>

<name>yarn.resourcemanager.webapp.address</name>

<value>Hmaster:8088</value>

</property>

</configuration>

vi masters

Hmaster

vi slaves

Hslave1

Hslave2

5、拷贝及配置

scp -r hadoop-2.6.4/ hadoop@172.168.2.4:~/

scp -r hadoop-2.6.4/ hadoop@172.168.2.6:~/

复制Hmaster的.bash_profile的配置到slave

修改/etc/sysconfig/network

6、测试

格式化namenode：hdfs namenode -format 三个节点都执行

启动hdfs：/sbin/start-dfs.sh

启动yarn：./sbin/start-yarn.sh

上传一个文件，才能正常查看到状态

查看集群状态：

hadoop dfsadmin -report

http://172.168.2.3:50070/

原创hadoop2.6集群环境搭建的更多相关文章

hadoop2.6集群环境搭建
版权声明:本文为博主原创文章,未经博主允许不得转载. 一.环境说明 1.机器:一台物理机和一台虚拟机 2.Linux版本:[Spark@S1PA11 ~]$ cat /etc/issueRed Ha ...
虚拟机centos6.5 --hadoop2.6集群环境搭建
一.环境说明虚拟机:virtualBox 系统:centos6.5,64位集群:3个节点 master 192.168.12.232 slave01 192.168.12.233 slave02 ...
hadoop2集群环境搭建
在查询了很多资料以后,发现国内外没有一篇关于hadoop2集群环境搭建的详细步骤的文章. 所以,我想把我知道的分享给大家,方便大家交流. 以下是本文的大纲: 1. 在windows7 下面安装虚拟机2 ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十）安装hadoop2.9.0搭建HA
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（二）安装hadoop2.9.0
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
Hadoop+Spark:集群环境搭建
环境准备: 在虚拟机下,大家三台Linux ubuntu 14.04 server x64 系统(下载地址:http://releases.ubuntu.com/14.04.2/ubuntu-14.0 ...
Spark 1.6.1分布式集群环境搭建
一.软件准备 scala-2.11.8.tgz spark-1.6.1-bin-hadoop2.6.tgz 二.Scala 安装 1.master 机器 (1)下载 scala-2.11.8.tgz, ...
hadoop集群环境搭建之安装配置hadoop集群
在安装hadoop集群之前,需要先进行zookeeper的安装,请参照hadoop集群环境搭建之zookeeper集群的安装部署 1 将hadoop安装包解压到 /itcast/ (如果没有这个目录 ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十三）kafka+spark streaming打包好的程序提交时提示虚拟内存不足（Container is running beyond virtual memory limits. Current usage: 119.5 MB of 1 GB physical memory used; 2.2 GB of 2.1 G）
异常问题:Container is running beyond virtual memory limits. Current usage: 119.5 MB of 1 GB physical mem ...

随机推荐

upload-labs学习笔记
项目地址:https://github.com/c0ny1/upload-labs 运行环境操作系统:windows.Linux php版本:推荐5.2.17(其他版本可能会导致部分Pass无法 ...
java-TreeMap
2019-12-17 10:34:55 //返回小于key的第一个键: K lowerKey(K key); //返回大于key的第一个键: K higherKey(K key); //返回小于等于k ...
win10 Redis闪退问题
问题:双击redis-server.exe,闪退解决办法:win+R,输入cmd进入命令行模式,接着cd进入Redis安装根目录,再输入:redis-server.exe redis.windows ...
一文带你入门Java Stream流，太强了
两个星期以前,就有读者强烈要求我写一篇 Java Stream 流的文章,我说市面上不是已经有很多了吗,结果你猜他怎么说:"就想看你写的啊!"你看你看,多么苍白的喜欢啊.那就&qu ...
Python IDE ——Anaconda+PyCharm的安装与配置
一前言最近莫名其妙地想学习一下Python,想着利用业余时间学习一下机器学习(或许仅仅是脑子一热吧).借着研究生期间对于PyCharm安装的印象,在自己的电脑上重新又安装了一遍.利用周末的一点时间 ...
SpringBoot系列之缓存使用教程
介绍SpringBoot项目中使用缓存,之前先介绍一下Spring的缓存抽象和JSR107,本博客是我在学习尚硅谷视频和参考其它博客之后做的笔记,仅供学习参考 @ 目录一.Spring的缓存抽象 1 ...
Arcgis中制作热力图
摘要使用核函数根据点或折线 (polyline) 要素计算每单位面积的量值以将各个点或折线 (polyline) 拟合为光滑锥状表面. 插图
cut-trailing-bytes：二进制尾部去0小工具
背景之前的文章二进制文件处理之尾部补0和尾部去0 中介绍了一种使用 sed 去除二进制文件尾部的 NULL(十六进制0x00)字节的方法. 最近发现这种方法有局限性,无法处理较大的文件.因为 se ...
AutoCompleteTextView的简单使用
1.AutoCompleteTextView功能自动完成文本框,由EditText派生而来,是一个文本编辑框,相较普通的文本编辑框多了提示功能,即用户输入一定数量的字符后,自动完成文本框会弹出一个下 ...
Python学习笔记：函数和变量详解
一.面向对象:将客观世界的事物抽象成计算机中的数据结构类:用class定义,这是当前编程的重点范式,以后会单独介绍. 二.函数编程:逻辑结构化和过程化的一种编程方法 1.函数-->用def定义 ...

原创hadoop2.6集群环境搭建

原创hadoop2.6集群环境搭建的更多相关文章

随机推荐

热门专题