hadoop2.7.2完全分布式环境搭建

1、先使用groupadd hadoop 建立hadoop用户组

2、新建用户，useradd -d /usr/hadoop -g hadoop -m hadoop （新建用户hadoop指定用户主目录/usr/hadoop 及所属组hadoop）

3、passwd hadoop 设置hadoop密码（这里设置密码为hadoop）

4、安装好jdk1.8版本，安装教材地址http://www.cnblogs.com/shihaiming/p/5809553.html（安装在/usr/local/jdk1.8目录）

5、拷贝hadoop2.7.3版本到Linux虚拟机上（放在目录/usr/hadoop/hadoop 中），到此基本环境已经完成，克隆虚拟机datanode1,datanode2,namenode,备份，总共四份虚拟机，为接下来省去安装虚拟机步骤。

6、修改主机名 vi /etc/hostname 分别改为datanode1,datanode2,namenode

7、配置hadoop 环境变量,修改hadoop用户目录下的.bash_profile文件

如图：

8、修改/etc/hosts 文件引入其他服务器主机名（datanode1,datanode2主机也相应做此操作）

8、修改usr/hadoop/hadoop/etc/hadoop/hadoop-env.sh 文件，修改内容如下：

a. 加入一行 export HADOOP_LOG_DIR=/usr/hadoop/log/hadoop ,如果不存在该日志路径，创建。

b. 设置jdk 安装路径 export JAVA_HOME=/usr/local/jdk1.8 (把配置文件中jdk配置去掉注释,并加上路径即可)

9、配置hadoop的文件/etc/hadoop/core-site.xm

<configuration>

    <property>

        <name>hadoop.tmp.dir</name>

        <value>/usr/hadoop/hadoop/tmp/</value>

        <description> Abase for other temporary directories</description>

    </property>

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://namenode:9000</value>

    </property>

    <property>

        <name>io.file.buffer.size</name>

        <value>4096</value>

    </property>

</configuration>

hdfs-site.xml

<configuration>

    <property>

        <name>dfs.nameservices</name>

        <value>namenode</value>

    </property>

    <property>

        <name>dfs.namenode.secondary.http-address</name>

        <value>namenode:50090</value>

    </property>

    <property>

        <name>dfs.datanode.data.dir</name>

        <value>/usr/hadoop/hadoop/dfs/data</value>

    </property>

    <property>

        <name>dfs.replication</name>

        <value>2</value>

    </property>

    <property>

        <name>dfs.webhdfs.enabled</name>

        <value>true</value>

    </property>

</configuration>

mapred-site.xml

<configuration>

    <property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

    </property>

    <property>

        <name>mapreduce.jobtracker.http.address</name>

        <value>namenode:50030</value>

    </property>

    <property>

        <name>mapreduce.jobhistory.address</name>

        <value>namenode:10020</value>

    </property>

    <property>

        <name>mapreduce.jobhistory.webapp.address</name>

        <value>namenode:19888</value>

    </property>

    <property>

        <!--see job-->

        <name>mapred.job.tracker</name>

        <value>namenode:9001</value>

    </property>

</configuration>

yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->

    <property>

        <name>yarn.nodemanager.aux.services</name>

        <value>mapreduce_shuffle</value>

    </property>

    <property>

        <name>yarn.resourcemanager.address</name>

        <value>namenode:8032</value>

    </property>

    <property>

        <name>yarn.resourcemanager.scheduler.address</name>

        <value>namenode:8030</value>

    </property>

    <property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>namenode:8031</value>

</property>

    <property>

        <name>yarn.resourcemanager.admin.address</name>

        <value>namenode:8033</value>

    </property>

    <property>

        <name>yarn.resourcemanager.web.address</name>

        <value>namenode:8088</value>

    </property>

</configuration>

在slaves文件中加入

datanode1

datanode2

把已经配置好的hadoop 拷贝到namenode ,datanode1,datanode2的/usr/hadoop/hadoop

10、配置hadoop集群中无密码登录

[hadoop@namenode ~]$ssh-keygen -t rsa (产生密钥和公钥，一直敲回车键，不需要输入密码,datanode1,datanoe2同样做此操作，下面命令只在namenode中进行)

[hadoop@namenode .ssh]$ cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys

[hadoop@namenode .ssh]$ ssh datanode1 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

[hadoop@namenode .ssh]$ ssh datanode2 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

然后把authorized_keys 分别拷贝到datanode1,datanode2 的.ssh目录下

重启sshd

systemctl restart sshd

尝试下是否实现了无密码切换服务器。

11、启动hadoop

start-dfs.sh

start-yarn.sh

这就大功告成了

hadoop2.7.2完全分布式环境搭建的更多相关文章

Hadoop-2.4.1完全分布式环境搭建
Hadoop-2.4.1完全分布式环境搭建 Hadoop-2.4.1完全分布式环境搭建一.配置步骤如下: 主机环境搭建,这里是使用了5台虚拟机,在ubuntu 13系统上进行搭建hadoop ...
Hadoop2.5.0伪分布式环境搭建
本章主要介绍下在Linux系统下的Hadoop2.5.0伪分布式环境搭建步骤.首先要搭建Hadoop伪分布式环境,需要完成一些前置依赖工作,包括创建用户.安装JDK.关闭防火墙等. 一.创建hadoo ...
hadoop2.4.1伪分布式环境搭建
注意:所有的安装用普通哟用户安装,所以首先使普通用户可以以sudo执行一些命令: 0.虚拟机中前期的网络配置参考: http://www.cnblogs.com/qlqwjy/p/7783253.ht ...
Hadoop2.8.1完全分布式环境搭建
前言本文搭建了一个由三节点(master.slave1.slave2)构成的Hadoop完全分布式集群(区别单节点伪分布式集群),并通过Hadoop分布式计算的一个示例测试集群的正确性. 本文集群三 ...
32位Ubuntu12.04搭建Hadoop2.5.1完全分布式环境
准备工作 1.准备安装环境: 4台PC,均安装32位Ubuntu12.04操作系统,统一用户名和密码交换机1台网线5根,4根分别用于PC与交换机相连,1根网线连接交换机和实验室网口 2.使用ifc ...
hadoop学习(三)----hadoop2.x完全分布式环境搭建
今天我们来完成hadoop2.x的完全分布式环境搭建,话说学习本来是一件很快乐的事情,可是一到了搭环境就怎么都让人快乐不起来啊,搭环境的时间比学习的时间还多.都是泪.话不多说,走起. 1 准备工作开 ...
Hadoop2.7.3+Spark2.1.0 完全分布式环境搭建全过程
一.修改hosts文件在主节点,就是第一台主机的命令行下; vim /etc/hosts 我的是三台云主机: 在原文件的基础上加上; ip1 master worker0 namenode ip2 ...
在Win7虚拟机下搭建Hadoop2.6.0伪分布式环境
近几年大数据越来越火热.由于工作需要以及个人兴趣,最近开始学习大数据相关技术.学习过程中的一些经验教训希望能通过博文沉淀下来,与网友分享讨论,作为个人备忘. 第一篇,在win7虚拟机下搭建hadoop ...
攻城狮在路上（陆）-- hadoop分布式环境搭建(HA模式)
一.环境说明: 操作系统:Centos6.5 Linux node1 2.6.32-431.el6.x86_64 #1 SMP Fri Nov 22 03:15:09 UTC 2013 x86_64 ...

随机推荐

webstrom使用手册
http://blog.csdn.net/kongjiea/article/details/48262851 http://www.jb51.net/article/58310.htm http:// ...
iOS 之 const
const int a与 int const a一样. const int *a ;//指针可以修改,指向常整形的指针 int* const a;// 常指针, int* 作为一个整体被限制, 所以指 ...
redhat6.4下安装Oracle11g
一.在Root用户下执行以下步骤: 1)修改用户的SHELL的限制,修改/etc/security/limits.conf文件 * soft nproc 2047 ...
Android 网格视图GridView的使用
网格视图GridView的排列方式与矩阵类似,当屏幕上有很多元素(文字.图片或其他元素)需要按矩阵格式进行显示时,就可以使用GridView控件来实现. 本文将以一个具体的实例来说明如何使用GridV ...
计算数据库中30天以内，30-60天，60-90天，90天以外的数据的个数（用sql实现）
30天以内:select count(*) from TB where datediff(day,字段名,getdate()) between 0 and 3030-60天:select count( ...
NodeJS异步I/O解析
在现在的项目开发中,任何一个大型项目绝对不是简简单单的采用一个种语言和一种框架,因为每种语言和框架各有优势,与其死守一个,不与取各家之所长,依次得到一个高性能.搞扩展的产品. 对于一个.NET开发者, ...
HTML5行业现状与未来 - 2016年终大盘点
* { margin: 0; padding: 0 } .con { width: 802px; margin: 0 auto; text-align: center; position: inher ...
AtomicInteger相关类
引用地址:http://blog.csdn.net/xh16319/article/details/17056767 在java6以后我们不但接触到了Lock相关的锁,也接触到了很多更加乐观的原子修改 ...
【python基础】 Tkinter 之几何管理器
Tkinter支持三种几何管理器:网格管理器,包管理器,位置管理器提示:由于每个管理器都有自己放置小构件的风格,最好不要在同一个容器中的小构件使用多个管理器.可以使用框架作为子容器以获取期望的布局. ...
2017qq红包雨最强攻略，
这个只支持苹果手机,而且要有苹果电脑,只有苹果手机是不行的. QQ红包规则:只要你到达指定的位置,就可以领取附近的红包,一般也就几毛,还有几分的,当然也不排除有更高的,只不过我是没遇到... 那么既然 ...

hadoop2.7.2完全分布式环境搭建

hadoop2.7.2完全分布式环境搭建的更多相关文章

随机推荐

热门专题