Linux中Hadoop的安装与配置

一、准备

1，配通网络 ping www.baidu.com

之前安装虚拟机时配过

2，关闭防火墙

systemctl stop firewalld

systemctl disable firewalld（开机自动关闭）

3，关闭 selinux

vi /etc/selinux/config

修改为selinux disabled

4，关闭 NetworkManager

systemctl stop NetworkManager

systemctl disable NetworkManager

5，修改计算机名 hadp01(根据个人喜好)

6，配置yum源

安装 yum install wget

做个备份 mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup

wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo

运行 yum makecache 生成缓存

7，备份，做个快照

二、Hadoop的安装与配置

1，下载hadoop

https://dist.apache.org/repos/dist/release/hadoop/common/

2，先创建几个目录

mkdir

/opt/install 上传

/opt/software 安装

/opt/other 其他

/opt/test 测试

a.上传 rz

解压 tar -zxvf jdk-8u181-linux-x64.tar.gz 和 tar -zxvf hadoop-2.7.7.tar.gz

jdk：

               cd /opt/install   #进入安装包目录

               rz   jdk-8u181-linux-x64.tar.gz   #上传JDK

               tar   -zxvf   jdk-8u181-linux-x64.tar.gz  #解压JDK

               mv  jdk1.8.0_181   ../software/jdk1.8   #移动到/opt/software目录

               Hadoop：

               cd  /opt/installed      #进入/opt/installed目录

               rz  hadoop-2.7.7.tar.gz   #上传hadoop2.7.7版本

               mv  hadoop-2.7.7.tar.gz  ../software/hadoop-2.7.7  #移动到software目录

   b.移动到安装目录中software   mv jdk1.8 ../software

                               mv hadoop-2.7.7  ../software

   c.配置环境变量

                  vim /etc/profile #编辑环境变量

                  JAVA_HOME=/opt/software/jdk1.8

                  HADOOP_HOME=opt/software/hadoop-2.7.7

                  PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin;$HADOOP_HOME/sbin

                  source /etc/profile   #使环境变量生效

                  测试 是否配置成功 echo  $PATH

3，伪分布式

A，修改主机名 vim /etc/hostname #编辑主机名文件

hadp01

B,修改主机映射

vim /etc/hosts #编辑主机映射文件

192.168.1.63（IP） hadp01（主机名）

C,实现ssh免密码登录

ssh-keygen #生成密钥对

ssh-copy-id hdp01 #将公钥拷贝给本机

ssh-copy-id hdp02 #将公钥拷贝给其他机

再回车一下会出来一个图形就OK了，重启

D,修改/opt/software/hadoop-2.7.7/etc/hadoop目录内的一系列文件

1.hadoop-env.sh

cd /opt/software/hadoop-2.7.7 #进入hadoop-2.7.7目录

       vim etc/hadoop/hadoop-env.sh        #编辑配置文件hadoop-env.sh

       export JAVA_HOME=/opt/software/jdk1.8  #修改25行

       export HADOOP_CONF_DIR=/opt/software/hadoop-2.7.7/etc/hadoop  #修改33行

    2.core-site.xml

       <configuration>

       <!-- 指定HDFS中NameNode的地址 -->

       <property>

            <name>fs.defaultFS</name>

            <value>hdfs://主机名:9000</value>

       </property>

       <!-- 指定hadoop运行时产生文件的存储目录 -->

       <property>

        <name>hadoop.tmp.dir</name>

        <value>/opt/software/hadoop-2.7.7/tmp</value>

       </property>

      </configuration>

   3.hdfs-site.xml

       <configuration>

        <!-- 指定HDFS副本的数量 -->

         <property>

             <name>dfs.replication</name>

             <value>1</value>

         </property>  

         <property>

             <name>dfs.permissions</name>

             <value>false</value>

         </property>

        </configuration>

   4.mapred-site.xml

       <!-- 指定mr运行在yarn上 -->

        <property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

        </property>

   5.yarn-site.xml

        <!-- 指定YARN的ResourceManager的地址 -->

         <property>

            <name>yarn.resourcemanager.hostname</name>

            <value>主机名</value>

         </property>

        <!-- reducer获取数据的方式 -->

         <property>

            <name>yarn.nodemanager.aux-services</name>

            <value>mapreduce_shuffle</value>

         </property>

 E，修改slaves文件

    vim etc/hadoop/slaves

    将里面的localhost删除 改为hadp01

 F,格式化文件系统

    hadoop namenode  -format

 G,启动Hadoop

   start-all.sh 全部启动

   stop-all.sh  全部关闭

 H，测试Hadoop

   http://主机IP:port/

   NameNode web工程 端口号：50070

　　 DataNode web工程端口号：50075

　　 SecondaryNameNode web工程端口号：50090

　　 ResourceManager web工程端口号：8088

Linux中Hadoop的安装与配置的更多相关文章

linux中neovim+tmux安装与配置遇到的问题
Neovim 安装与配置安装 pip3 install neovim 之前安装过anaconda,默认安装python3和pip3 检查状态 :checkhealth 终端输入'nvim' 进入nv ...
linux中Jetty的安装和配置
Jetty Jetty 是一个开源的servlet容器,它为基于Java的web内容,例如JSP和servlet提供运行环境.Jetty是使用Java语言编写的,它的API以一组JAR包的形式发布.开 ...
Linux中数据库的安装和配置(MySQL与Maria DB)
目录 MySQL和Maria DB的介绍 MySQL和Maria DB的安装 yum源安装MySQL(Centos6.5+Mysql5.1) 源码包安装MySQL yum源安装Maria DB 源码包 ...
linux中jdk的安装与配置
一.卸载系统已有的JDK 1.查看已安装的jdk rpm -qa|grep jdk 2.卸载jdk rpm -e --nodeps java-1.6.0-openjdk-1.6.0.0-1.66.1. ...
Linux中redis的安装与配置
redis官网地址:http://www.redis.io/ redis安装在Linux下安装Redis非常简单,这里以2.8.3版本为例,具体步骤如下: 1.下载源码,解压缩后编译源码. $ mk ...
ubuntu在虚拟机下的安装 ~~~ Hadoop的安装及配置 ~~~ Hdfs中eclipse的安装
前言 Hadoop是基于Java语言开发的,具有很好跨平台的特性.Hadoop的所要求系统环境适用于Windows,Linux,Mac系统,我们推荐选择使用Linux或Mac系统.而Linux系统则 ...
在本机eclipse中创建maven项目，查看linux中hadoop下的文件、在本机搭建hadoop环境
注意第一次建立maven项目时需要在联网情况下,因为他会自动下载一些东西,不然突然终止需要手动删除断网前建立的文件在eclipse里新建maven项目步骤直接新建maven项目出了错 ...
Ubuntu下伪分布式模式Hadoop的安装及配置
1.Hadoop运行模式Hadoop有三种运行模式,分别如下:单机(非分布式)模式伪分布式(用不同进程模仿分布式运行中的各类节点)模式完全分布式模式注:前两种可以在单机运行,最后一种用于真实的集群环境 ...
Linux中环境变量文件及配置
Linux中环境变量文件及配置一.环境变量文件介绍转自:http://blog.csdn.net/cscmaker/article/details/7261921 Linux中环境变量包括系统 ...

随机推荐

Objectarx 相交矩形求并集面域转多段线
测试结果: 主要思路:拾取一个点作为矩形的插入点,分别以该点进行两次jig操作,就能得到白色的两个相交的polyline,之后需要变成红色的封闭多段线.做法就是:求出两个白色矩形的面域,然后通过boo ...
超级火的java自学网站
学靠的是毅力和自律,一定要坚持,否则就会前功尽弃,我自己也一直在边学边工作,当然自学要配合好的学习资料. 我是通过这个地方去学习的,它可以添加学习计划,从java基础到高级,从后台到前端,从细节到框架 ...
python条件（三元）运算符
条件运算符是三元运算符语法: 语句1 if 条件表达式 else 语句2 执行流程: 条件运算符在执行时,会先对条件表达式进行求值判断如果判断结果为True,则执行 ...
APICloud联合腾讯云推出“云主机解决方案“，各种福利等你拿
为了帮助开发者一站式打通云.开发.运维全流程服务,更全面提供基于自身业务情况的云服务器.数据库.存储等基础设施服务,APICloud联合腾讯云重磅推出“云主机解决方案“.开发者可通过控制台简单清晰的购 ...
《C# 爬虫破境之道》：第一境爬虫原理 — 第六节：第一境尾声
在第一境中,我们主要了解了爬虫的一些基本原理,说原理也行,说基础知识也罢,结果就是已经知道一个小爬虫是如何诞生的了~那么现在,请默默回想一下,在第一境中,您都掌握了哪些内容?哪些还比较模糊?如果还有什 ...
Vmware Ubuntu18.04更换清华源
一.安装Ubuntu18.04 省略二.安装VmwareTool 1.选择机器右击安装2.打开文件,copy压缩文件到其它目录(理由: 内存不够解压)3.解压文件,运行./忘记名字了.pl文件4.注 ...
为BlueLake主题增加自定义icon图标
一.前言 hexo 的 Bluelake 主题是我一直在用的,简单大方,很喜欢.但最近有了添加自定义 icon 图标的需求,比如,添加 "地址"."扫一扫".& ...
机器学习回顾篇（15）：集成学习之GDBT
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
ios---选择多张图片
#import "ViewController.h" #import <CTAssetsPickerController.h> @interface ViewContr ...
网络流（最大流-Dinic算法）
摘自https://www.cnblogs.com/SYCstudio/p/7260613.html 网络流定义在图论中,网络流(Network flow)是指在一个每条边都有容量(Capacity ...

Linux中Hadoop的安装与配置

Linux中Hadoop的安装与配置的更多相关文章

随机推荐

热门专题