Hadoop环境搭建(centos)

本平台密码83953588abc

配置Java环境

下载JDK(本实验从/cgsrc 文件中复制到指定目录)

    mkdir /usr/local/java

    cp /cgsrc/jdk-8u171-linux-x64.tar.gz /usr/local/java/

JDK至少1.8以上！！！

解压JDK安装包

    cd /usr/local/java

    tar -zxvf jdk-8u171-linux-x64.tar.gz

    rm -f jdk-8u171-linux-x64.tar.gz

添加环境变量

配置JAVA_HOME环境变量。修改文件vim ~/.bashrc

    export JAVA_HOME=/usr/local/java/jdk1.8.0_171

    export CLASSPATH=.:${JAVA_HOME}/jre/lib/rt.jar:${JAVA_HOME}/lib/dt.jar

    export PATH=$PATH:${JAVA_HOME}/bin

如果PATH环境变量修改错误，则可能出现Linux常用命令无法找到的现象！！！

使修改环境生效，source ~/.bashrc.

检查是否设置正确.

    echo $JAVA_HOME   #检查变量值

    java -version     #查看java版本

配置分布式模式

选定一台机器作为名称节点(Master)，另外两条作为数据节点(Slave)。

配置hosts文件

在Master上修改/etc/hosts文件：

使用命令vim /etc/hosts

    ip1  master

    ip2  slave1

    ip3  slave2

测试节点之间是否已经联通：

    ping master -c 3

    ping slave1 -c 3

    ping slave2 -c 3

配置SSH无密码登录

必须要让master节点可以SSH无密码登录到各个节点上。首先，生成master节点的公匙，如果之前已经生成过公匙，必须删除原来的公匙，重新生成一次，命令如下：

    cd ~/.ssh  #如果没有该目录，先执行一次ssh localhost

    rm -f ./id_rsa*  #删除之前生成的公匙

    ssh-keygen -t rsa  #执行该命令后，遇到提示信息，均按Enter即可。

为了让master节点能无密码SSH登录到本机，需要在mater节点上执行如下 cat ./id_rsa.pub >> ./authorized_keys.

检测是否成功，ssh master ,遇到提示信息，yes即可, exit退出。
把master上的公匙传输到slave节点：

    scp ~/.ssh/id_rsa.pub root@slave1:/root

    scp ~/.ssh/id_rsa.pub root@slave1:/root

其中本次实验平台，要把slave1、slave2换成相应的IP。

传输完成后在slave1和slave2节点上将SSH公匙加入授权：

    mkdir ~/.ssh

    cat ~/id_rsa.pub >> ~/.ssh/authoried_keys

    rm -f ~/id_rsa.pub

配置环境变量

将Hadoop安装包复制到/usr/local目录上：

cp /cgsrc/hadoop-2.7.1.tar.gz /usr/local/
解压

    cd /usr/local

    tar -zxvf hadoop-2.7.1.tar.gz

    rm -f hadoop-2.7.1.tar.gz

    mv hadoop-2.7.1/ hadoop  #将hadoop-2.7.1重命名为hadoop

配置环境变量
- 打开~/.bashrc文件
  
  vim ~/.bashrc
- 输入以下内容
  
  export PATH=$PATH:/usr/1ocal/hadoop/bin:/usr/1ocal/hadoop/sbin
- 文件生效
  
  source ~/.bashrc
- 查看hadoop版本
  
  hadoop version

配置集群环境

配置集群环境时，需要修改/usr/local/hadoop/etc/hadoop目录下的配置文件，这里仅设置正常启动必须的设置项，包括slaves、core-site.xml、hdfs

-site.xml、mapred-site.xml、yarn-site.xml共五个文件。

修改文件slaves

需要把所有数据节点的主机名写入该文件，每行一个，默认为localhost

（即把本机作为数据节点）。在进行集群配置时，可以保留localhost，让master节点同时充当名称节点和数据节点，也可以删除localhost这行，让master节点仅作为名称节点使用。

本节让master节点仅作为名称节点使用，因此将slaves文件中原来的内容删除，添加如下内容：

slave1

slave2
修改文件core-site.xml

<configuration>

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://master:9000</value>

    </property>

    <property>

        <name>hadoop.tmp.dir</name>

        <value>file:/usr/1ocal/hadoop/tmp</value>

    </property>

</configuration>

修改文件hdfs-site.xml

对于Hadoop的分布式文件系统HDFS而言，一般是采用元余存储，冗余因子一般是3，也就是说一份数据保存3份副本。而我们只有两个数据节点，即数据只能保存两份，所以，dfs.replication设置为2，文件具体内容如下：

<configuration>

    <property>

    <name>dfs.namenode.secondary.http-address</name>

    <value>master:50090</value>

    </property>

    <property>

        <name>dfs.replication</name>

        <value>2</value>

    </property>

    <property>

        <name>dfs.namenode.name.dir</name>

        <value>file:/usr/1ocal/hadoop/tmp/dfs/name</value>

    </property>

    <property>

        <name>dfs.datanode.data.dir</name>

        <value>file:/usr/1ocal/hadoop/tmp/dfs/date</value>

    </property>

</configuration>

修改文件mapred-site.xml

/usr/local/hadoop/etc/hadoop 目录下有一个mapred-site.xml.template，需要复制该文件为mapred-site.xml：

cp mapred-site.xml.template mapred-site.xml

<configuration>

    <property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

    </property>

    <property>

        <name>mapreduce.jobhistory.address</name>

        <value>master:10020</value>

    </property>

    <property>

        <name>mapreduce.jobhistory.webapp.address</name>

        <value>master:19888</value>

    </property>

</configuration>

修改文件yarn-site.xml

<configuration>

    <property>

        <name>yarn.resourcemanager.hostname</name>

        <value>master</value>

    </property>

    <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

    </property>

</configuration>

配置slave节点

将master节点上的/usr/local/hadoop复制到slave节点上。

    cd /usr/local

    rm -rf ./hadoop/tmp #删除临时文件

    rm -rf ./hadoop/1ogs/* #删除日志文件

    tar -zcf ~/hadoop.master.tar.gz. /hadoop #先压缩再复制

    cd ~

    scp ./hadoop.master.tar.gz  root@slave1: /root

    scp ./hadoop.master.tar.gz  root@slave2: /root

在slave1和slave2上执行如下命令：

    rm -rf usr/local/hadoop #如果有旧文件则先删除

    tar -zxf ~/hadoop.master.tar.gz -C /usr/1ocal

    rm -f ~/hadoop.master.tar.gz

启动Hadoop集群

首次启动Hadoop集群时，需要先在master节点执行名称节点的格式化：

hdfs namenode-format
现在可以启动Hadoop了，启动需要在master节点上进行，执行如下命令：

    start-dfs.sh

    start-yarn.sh

    mr-jobhistory-daemon.sh start historyserver

Hadoop环境搭建(centos)的更多相关文章

hadoop环境搭建之关于NAT模式静态IP的设置 ---VMware12+CentOs7
很久没有更新了,主要是没有时间,今天挤出时间验证了一下,果然还是有些问题的,不过已经解决了,就发上来吧. PS:小豆腐看仔细了哦~ 关于hadoop环境搭建,从单机模式,到伪分布式,再到完全分布式,我 ...
环境搭建-CentOS集群搭建
环境搭建-CentOS集群搭建写在前面最近有许多小伙伴问我,大数据的hadoop分布式集群该如何去搭建.所以,想着,就写一篇博客,帮助到更多刚入门大数据的人.本博客会一步一步带你实现一个Hadoo ...
转史上最详细的Hadoop环境搭建
GitChat 作者:鸣宇淳原文:史上最详细的Hadoop环境搭建关注公众号:GitChat 技术杂谈,一本正经的讲技术 [不要错过文末活动哦] 前言 Hadoop在大数据技术体系中的地位至关重要 ...
【转】RHadoop实践系列之一:Hadoop环境搭建
RHadoop实践系列之一:Hadoop环境搭建 RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析.Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来 ...
eclipse工具下hadoop环境搭建
eclipse工具下hadoop环境搭建: window10操作系统中搭建eclipse64开发系统,配置hadoop的eclipse插件,让eclipse可以查看Hdfs中的文件内容. ...
大数据学习之Hadoop环境搭建
一.Hadoop的优势 1)高可靠性:因为Hadoop假设计算元素和存储会出现故障,因为它维护多个工作数据副本,在出现故障时可以对失败的节点重新分布处理. 2)高扩展性:在集群间分配任务数据,可方便的 ...
Hadoop环境搭建、启动和管理界面查看
一.hadoop环境搭建: 1. hadoop 6个核心配置文件的作用:core-site.xml:核心配置文件,主要定义了我们文件访问的格式 hdfs://hadoop-env.sh:主要配置我们的 ...
Ubuntu中Hadoop环境搭建
Ubuntu中Hadoop环境搭建 JDK安装方法一:通过命令行直接安装(不建议) 有两种java可以安装oracle-java8-installer以及openjdk (1)安装oracle-ja ...
Linux集群搭建与Hadoop环境搭建
今天是8月19日,距离开学还有15天,假期作业完成还是遥遥无期,看来开学之前的恶补是躲不过了今天总结一下在Linux环境下安装Hadoop的过程,首先是对Linux环境的配置,设置主机名称,网络设置 ...

随机推荐

一起了解 .Net Foundation 项目 No.22
.Net 基金会中包含有很多优秀的项目,今天就和笔者一起了解一下其中的一些优秀作品吧. 中文介绍中文介绍内容翻译自英文介绍,主要采用意译.如与原文存在出入,请以原文为准. Windows Templ ...
shell脚本基础知识以及变量
一.基础知识 1.shell脚本的格式注意事项第一行(一般必须写明):指定脚本使用的shell(若不写明也不影响脚本的执行,系统会自动以sh解析脚本)."#!/bin/bash" ...
Hive学习笔记七
目录函数一.系统自带函数二.自定义函数三.自定义UDF函数开发案例压缩和存储一.Hadoop源码编译支持Snappy压缩 1.资源准备 2.jar包安装 3.编译源码二.Hadoop压缩 ...
Netty耗时的业务逻辑应该写在哪儿，有什么注意事项？
更多技术分享可关注我前言 Netty以高性能著称,但是在实际使用中,不可避免会遇到耗时的业务逻辑,那么这些耗时操作应该写在哪儿呢,有什么注意的坑吗?本篇文章将一一总结. Netty线程调度模型回顾 ...
Js,JQuery不同方式绑定的同一事件可以同时触发,互不干扰
比如,onclick绑定,然后jquery.on("click", function(){})绑定等
Python第三方包之PrettyTable
Python第三方包之PrettyTable 可以让我们将数据用表格的方式展示出来安装方式 pip install PrettyTable 测试是否安装成功使用方法与对比增加一条数据先简单的看 ...
vue实现选项卡切换--不用ui库
vue的ui库中基本都有选项卡切换的组件,但是在项目开发过程中却不一定能很好的为我们所用,因为里面的样式和一些状态并不能很好的根据我们的项目需求进行定制.最近项目中使用的是vant-ui中的标签页, ...
Codeforces Global Round 7
A. Bad Ugly Numbers 思路题意: 给我们一个k,让我们用 0-9 之间的数字构成一个 k位数a,a不能被组成a的每一位数字整除. 分析:首先 k等于1,无论我们怎么配都会被整除:当 ...
E1. String Coloring (easy version)（贪心）
E1. String Coloring (easy version) time limit per test 1 second memory limit per test 256 megabytes ...
EF 太重，MyBatis 太轻，ORM 框架到底怎么选 ?
以 EF 为代表的基于 Linq 的 ORM 框架总是很重. 他们的功能早已超出了一个 ORM 的范畴, ORM 是 Object Relational Mapping ,从名字上看,其初衷是将数 ...

Hadoop环境搭建(centos)

Hadoop环境搭建(centos)

配置Java环境

配置分布式模式

配置hosts文件

配置SSH无密码登录

配置环境变量

配置集群环境

配置slave节点

启动Hadoop集群

Hadoop环境搭建(centos)的更多相关文章

随机推荐

热门专题