Linux巩固记录（3） hadoop 2.7.4 环境搭建

由于要近期使用hadoop等进行相关任务执行，操作linux时候就多了

以前只在linux上配置J2EE项目执行环境，无非配置下jdk，部署tomcat，再通过docker或者jenkins自动部署上去

看下进程，复制粘贴删除等基本操作，很多东西久了不用就忘了，所有写个demo巩固下曾经的linux知识

后续会有hadoop等主流的大数据相关环境的搭建及使用

---------------------------------------------------------------------------------------------------------------------------------------------------------

这次讲hadoop 2.7.4环境搭建

本次需要三个节点操作用户均为root

192.168.0.80 master
192.168.0.81 slave1
192.168.0.82 slave2

1.按照 Linux巩固记录（1） J2EE开发环境搭建及网络配置配置好三台虚拟机的网络和jdk 并能互通（都关掉防火墙）

2.更改80虚拟机hostname为master，81为slave1,82为slave2

　vi /etc/sysconfig/network

　以80为例：删除localhost 增加 HOSTNAME=master

3.修改三台虚拟机的hosts，三台虚拟机一样

　vi /etc/hosts

192.168.0.80 master

192.168.0.81 slave1

192.168.0.82 slave2

4.修改sshd配置

vi /etc/ssh/sshd_config

#放开注释
RSAAuthentication yes
PubkeyAuthentication yes

5.三台虚拟机全部重启 shutdown -r now

--------------------------------------------------------------

6.ssh key配置，

cd ~/.ssh #（.ssh是目录，如果没有，执行$ ssh xxxxxx）

#master

ssh master

ssh-keygen –t rsa

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

scp -r root@slave1:~/.ssh/id_rsa.pub slave1.pub

scp -r root@slave2:~/.ssh/id_rsa.pub slave2.pub

cat ~/.ssh/slave2.pub >> ~/.ssh/authorized_keys

cat ~/.ssh/slave1.pub >> ~/.ssh/authorized_keys

#slave1

ssh slave1

ssh-keygen –t rsa

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

scp -r root@master:~/.ssh/id_rsa.pub master.pub

scp -r root@slave2:~/.ssh/id_rsa.pub slave2.pub

cat ~/.ssh/slave2.pub >> ~/.ssh/authorized_keys

cat ~/.ssh/master.pub >> ~/.ssh/authorized_keys

#slave2

ssh slave2

ssh-keygen –t rsa

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

scp -r root@master:~/.ssh/id_rsa.pub master.pub

scp -r root@slave1:~/.ssh/id_rsa.pub slave1.pub

cat ~/.ssh/slave1.pub >> ~/.ssh/authorized_keys

cat ~/.ssh/master.pub >> ~/.ssh/authorized_keys

配置完毕后可以无密码登录如master中到salve1 ssh slave1

[root@master /]# ssh slave1

Last login: Wed Aug 30 21:34:51 2017 from slave2

[root@slave1 ~]#

hadoop配置只需要在master上进行，配置完成后复制到slave上即可

7. 下载hadoop 2.7.4压缩包到master /home下并解压重命名为 hadoop-2.7.4 tar -xzvf xxxxxx /home/hadoop-2.7.4

并设置hadoop环境变量

vi /etc/profile

export HADOOP_HOME=/home/hadoop-2.7.4

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop

vi /home/hadoop-2.7.4/etc/hadoop/hadoop-env.sh 设置JAVA_HOME
vi /home/hadoop-2.7.4/etc/hadoop/mapred-env.sh 设置JAVA_HOME

9 修改 /home/hadoop-2.7.4/etc/hadoop/core-site.xml

<configuration>

       <property>

                <name>fs.defaultFS</name>

                <value>hdfs://master:9000</value>

        　　　　 <description>设定namenode的主机名及端口(建议不要更改端口号)</description>

       </property>

       <property>

                <name>io.file.buffer.size</name>

                <value>131072</value>

        <description> 设置缓存大小 </description>

        </property>

       <property>

               <name>hadoop.tmp.dir</name>

               <value>file:/home/hadoop-2.7.4/tmp</value>

               <description> 存放临时文件的目录 </description>

       </property>

       <property>

            <name>hadoop.security.authorization</name>

            <value>false</value>

        </property>

</configuration>

10 修改 /home/hadoop-2.7.4/etc/hadoop/hdfs-site.xml

<configuration>

    <property>

        <name>dfs.namenode.name.dir</name>

        <value>file:/home/hadoop-2.7.4/hdfs/name</value>

        <description> namenode 用来持续存放命名空间和交换日志的本地文件系统路径 </description>

    </property>

    <property>

        <name>dfs.datanode.data.dir</name>

        <value>file:/home/hadoop-2.7.4/hdfs/data</value>

        <description> DataNode 在本地存放块文件的目录列表，用逗号分隔 </description>

    </property>

    <property>

        <name>dfs.replication</name>

        <value>2</value>

        <description> 设定 HDFS 存储文件的副本个数，默认为3 </description>

    </property>

    <property>

        <name>dfs.webhdfs.enabled</name>

        <value>true</value>

    </property>

    <property>

        <name>dfs.permissions</name>

        <value>false</value>

    </property>

</configuration>

11 修改 /home/hadoop-2.7.4/etc/hadoop/mapred-site.xml

<configuration>

    <property>

        <name>mapreduce.framework.name</name>

                <value>yarn</value>

                <final>true</final>

        </property>

    <property>

        <name>mapreduce.jobtracker.http.address</name>

        <value>master:50030</value>

    </property>

    <property>

            <name>mapreduce.jobhistory.address</name>

            <value>master:10020</value>

    </property>

    <property>

            <name>mapreduce.jobhistory.webapp.address</name>

            <value>master:19888</value>

    </property>

        <property>

                <name>mapred.job.tracker</name>

                <value>http://master:9001</value>

        </property>

</configuration>

12 修改 /home/hadoop-2.7.4/etc/hadoop/yarn-site.xml

<configuration>

        <property>

               <name>yarn.nodemanager.aux-services</name>

               <value>mapreduce_shuffle</value>

        </property>

        <property>

                <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

               <value>org.apache.hadoop.mapred.ShuffleHandler</value>

        </property>

        <property>

               <name>yarn.resourcemanager.address</name>

               <value>master:8032</value>

       </property>

       <property>

               <name>yarn.resourcemanager.scheduler.address</name>

               <value>master:8030</value>

       </property>

       <property>

            <name>yarn.resourcemanager.resource-tracker.address</name>

             <value>master:8031</value>

      </property>

      <property>

              <name>yarn.resourcemanager.admin.address</name>

               <value>master:8033</value>

       </property>

       <property>

               <name>yarn.resourcemanager.webapp.address</name>

               <value>master:8088</value>

       </property>

</configuration>

13 创建对应的文件夹 mkdir -p logs （其实可以先创建好了文件夹再复制，文件夹多了不影响）

在每个节点上创建数据存储目录/home/hadoop-2.7.4/hdfs 用来存放集群数据。
在主节点node上创建目录/home/hadoop-2.7.4/hdfs/name 用来存放文件系统元数据。
在每个从节点上创建目录/home/hadoop-2.7.4/hdfs/data 用来存放真正的数据。
所有节点上的日志目录为/home/hadoop-2.7.4/logs
所有节点上的临时目录为/home/hadoop-2.7.4/tmp

14复制配置好的配置到slave节点

scp -r /home/hadoop-2.7.4 root@slave1:/home/hadoop-2.7.4

scp -r /home/hadoop-2.7.4 root@slave2:/home/hadoop-2.7.4

15 在master节点上配置hadoop salve配置文件增加节点

vi /home/hadoop-2.7.4/etc/hadoop/slaves

增加

salve1

slave2

16格式化namenode和datanode并启动，（在master上执行就可以了不需要在slave上执行）

/home/hadoop-2.7.4/bin/hadoop namenode -format

/home/hadoop-2.7.4/bin/hadoop datanode -format

/home/hadoop-2.7.4/sbin/start-all.sh

17 通过jps命令查看是否启动成功

[root@master ~]# ssh master

Last login: Sat Sep  2 00:47:50 2017 from slave1

[root@master ~]# jps

9187 Jps

3221 ResourceManager

3062 SecondaryNameNode

2856 NameNode

[root@master ~]# ssh slave1

Last login: Sat Sep  2 00:25:55 2017 from master

[root@slave1 ~]# jps

6044 Jps

2685 NodeManager

2590 DataNode

[root@slave1 ~]# ssh slave2

Last login: Wed Aug 30 21:34:38 2017 from master

j[root@slave2 ~]# jps

2679 NodeManager

5994 Jps

2590 DataNode

[root@slave2 ~]#

如果启动异常，一定要仔细看log并修正配置

Linux巩固记录（3） hadoop 2.7.4 环境搭建的更多相关文章

Linux巩固记录（1） J2EE开发环境搭建及网络配置
由于要近期使用hadoop等进行相关任务执行,操作linux时候就多了以前只在linux上配置J2EE项目执行环境,无非配置下jdk,部署tomcat,再通过docker或者jenkins自动部署上 ...
Samsung_tiny4412(驱动笔记01)----linux 3.5,U-Boot,Busybox,SD卡启动环境搭建
/*********************************************************************************** * * linux 3.5,U ...
Hadoop源码阅读环境搭建（IDEA）
拿到一份Hadoop源码之后,经常关注的两件事情就是 1.怎么阅读?涉及IDEA和Eclipse工程搭建.IDEA搭建,选择源码,逐步导入即可:Eclipse可以选择后台生成工程,也可以选择IDE导入 ...
【Hadoop基础教程】4、Hadoop之完全分布式环境搭建
上一篇blog我们完成了Hadoop伪分布式环境的搭建,伪分布式模式也叫单节点集群模式, NameNode.SecondaryNameNode.DataNode.JobTracker.TaskTrac ...
Windows10系统下Hadoop和Hive开发环境搭建填坑指南
前提笔者目前需要搭建数据平台,发现了Windows系统下,Hadoop和Hive等组件的安装和运行存在大量的坑,而本着有坑必填的目标,笔者还是花了几个晚上的下班时候在多个互联网参考资料的帮助下完成了 ...
Hadoop+Spark:集群环境搭建
环境准备: 在虚拟机下,大家三台Linux ubuntu 14.04 server x64 系统(下载地址:http://releases.ubuntu.com/14.04.2/ubuntu-14.0 ...
Hadoop基础教程-运行环境搭建
一.Hadoop是什么一个分布式系统基础架构,由Apache基金会所开发.用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群的威力进行高速运算和存储. Hadoop实现了一个分布式 ...
[转载] Hadoop和Hive单机环境搭建
转载自http://blog.csdn.net/yfkiss/article/details/7715476和http://blog.csdn.net/yfkiss/article/details/7 ...
Hadoop系列003-Hadoop运行环境搭建
本人微信公众号,欢迎扫码关注! Hadoop运行环境搭建 1.虚拟机网络模式设置为NAT 2.克隆虚拟机 3.修改为静态ip 4. 修改主机名 5.关闭防火墙 1)查看防火墙开机启动状态 chkcon ...

随机推荐

基于python的二元霍夫曼编码译码详细设计
一.设计题目对一幅BMP格式的灰度图像(个人证件照片)进行二元霍夫曼编码和译码二.算法设计 (1)二元霍夫曼编码: ①:图像灰度处理: 利用python的PIL自带的灰度图像转换函数,首先将彩色图 ...
[补] winpcap编程——EAPSOCKET实现校园网锐捷登录(mentohust)
EAP SOCKET Implement Mentohust 时间20161115 对于EAP协议不了解,可参考上一篇随笔. 通过抓包分析校园网的锐捷登录流程,我在上一篇随笔中实现了EAPSOCKET ...
UWP中使用Composition API实现吸顶（1）
前几天需要在UWP中实现吸顶,就在网上找了一些文章: 吸顶大法 -- UWP中的工具栏吸顶的实现方式之一在UWP中页面滑动导航栏置顶发现前人的实现方式大多是控制ListViewBase的Heade ...
JStorm与Storm源码分析（一）--nimbus-data
Nimbus里定义了一些共享数据结构,比如nimbus-data. nimbus-data结构里定义了很多公用的数据,请看下面代码: (defn nimbus-data [conf inimbus] ...
智慧航空AI大赛-阿里云算法大赛总结第一赛季总结
[以前的文章]最后一公里极速配送 - 阿里云算法大赛总结总结一下新的教训 1.由于都是NP难题,获得最优解用常规的方法非常困难,对于不是算法科班出身的人来说,首先应该到网络上寻找一下论文,是否有一些 ...
[补档]暑假集训D8总结
%dalao 今天有两位大佬来讲课,meaty来讲了Catalan(本来说好的莫比乌斯反演呢),聪聪来讲Splay呢至于听课笔记= =,没来得及记= = 不过好不想上树啊,上了树就下不来了考试仍 ...
Vue组件模板形式实现对象数组数据循环为树形结构
数据结构为数组中包含对象--树形结构,用Vue组件的写法实现以下的效果: 树形列表,缩进显示层级,第5级数据加底色,数据样式显色,点击展开折叠数据.本文为用Vue实现方式,另有一篇为用knockout ...
akoj-1059-Picture
Description 给你一个矩形的宽度和高度,要求按sample output样例输出此矩形. Input 输入包含多组数据,每一组包含两个数N和M( 0 < N ,M , < 75 ...
--使用oracle数据先要创建表空间
one\--创建表空间 CREATE TABLESPACE 表空间的名字DATAFILE 'E:\oracle\app\userdata\java5space.dbf' --表空间物理文件路径SIZE ...
表空间移动（transporting tablespaces）
--表空间移动(transporting tablespaces) --------------------------------------2014/01/15 1. 表空间传输步骤简介. ...

Linux巩固记录（3） hadoop 2.7.4 环境搭建

Linux巩固记录（3） hadoop 2.7.4 环境搭建的更多相关文章

随机推荐

热门专题