---恢复内容开始---

1.CentOS主机配置

在配置Hadoop过程中,防火墙必须优先关闭SELinux,否则将影响后续Hadoop配置与使用,命令如下:

# 查看 “系统防火墙” 状态命令

systemctl status firewalld.service

# 关闭 “系统防火墙” 命令

systemctl stop firewalld.service

# 关闭 “系统防火墙” 自启动命令

systemctl disable firewalld.service

# 关闭 “SELinux”命令

setenforce 0

# 关闭“SELinux”系统系统自启动服务

vi /etc/selinux/config

# 修改内容

SELINUX=disabled

(1)执行图结果如下:

(2)上图的防火墙处于运行状态,现在关闭防火墙,如下图:

(3)关闭防火墙后,因为重启服务器防火墙会自动重启,关闭系统自启动命令如下:

# systemctl  firewalld.service

2.设置主机名称

(1)使用vi编译器编译 #vi /etc/sysconfig/network,修改其内容:

# 修改为:

NETWORKING=yes

HOSTNAME=master

(2)修改主机名,进入#vi /etc/hostname里修改内容:

# 修改为: master

3.配置hosts文件

(1)编译#vi /etc/hosts添加内容,不用去掉原先内容:

#添加内容

192.168.56.110 master

(2)192.168.56.110为IP地址。

4.验证配置结果

(1)重启后主机为master。

# 重启系统命令

reboot now

(2)在终端输入命令 #ping master -c 5查看是否成功。

5.JavaJDK环境配置

(1)上传JDK文件,使用xftp将jdk传到/opt目录下,如图:

(2)解压缩JDK安装包

进入/opt 目录并解 压 缩 文 件 #tar -zxvf /opt/jdk-8u162-linux-x64.tar.gz

(3)移动 javaJDK 目录至/usr/local/java 中 ,其环境变量地址与Java目录一致

#mv /opt/jdk1.8.0_162 /usr/local/java

(4)配置环境变量

编辑 .bash_profile 文件 :

#vi /root/.bash_profile

添加内容 :

export  JAVA_HOME=/usr/local/java

export  PATH=$JAVA_HOME/bin:$PATH

使环境变量生效:

#source /root/.bash_profile

(5)验证JDK配置是否成功,使用# java -version,结果如下:

6.Hadoop安装与配置

(1)使用xftp将Hadoop软件包上传至/opt下,如图:

(2)解压Hadoop

上传完成后,解压缩文件 #tar -zxvf /opt/hadoop-2.7.5.tar.gz

修改 hadoop-2.7.6-src 目录名称为 hadoop

#mv /opt/hadoop-2.7.5 /opt/hadoo

(3)配置环境变量

编辑 .bash_profile 文件:

#vi /root/.bash_profile
 
添加内容 :

export HADOOP_HOME=/opt/hadoop

export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

(4)添加完成后,输入命令 #source /root/.bash_profile 使环境变量生效。

7.配置其文件

(1)配置core-site.xml 文件

#vi /opt/hadoop/etc/hadoop/core-site.xml

配置其内容:

在<configuration>补充区域</configuration>中间补充

补充内容,如下

<property>

  <name>fs.defaultFS</name>

  <value>hdfs://master:9000</value>

</property>

<property>

  <name>hadoop.tmp.dir</name>

  <value>/opt/hadoop/hadoopdata</value>

</property>

(2)配置文件系统hdfs-site.xml

#  vi /opt/hadoop/etc/hadoop/hdfs-site.xml 
 配置内容如下 :

<property>

  <name>dfs.replication</name>

  <value>1</value>

</property>

(3)配置资源管理器yarn-site.xml

#vi /opt/hadoop/etc/hadoop/yarn-site.xml

补充内容:

<property>   
  <name>yarn.nodemanager.aux-services</name>

  <value>mapreduce_shuffle</value>

</property>

<property>

  <name>yarn.resourcemanager.address</name>

  <value>master:18040</value>

</property>

<property>

  <name>yarn.resourcemanager.scheduler.address</name>

  <value>master:18030</value>

</property>

<property>

  <name>yarn.resourcemanager.resource-tracker.address</name>

  <value>master:18025</value>

</property>

<property>

  <name>yarn.resourcemanager.admin.address</name>

  <value>master:18141</value>

</property>

<property>

  <name>yarn.resourcemanager.webapp.address</name>

  <value>master:18088</value>

</property>

(4)配置添加计算框架mapred-site.xml

复制文件

#cp /opt/hadoop/etc/hadoop/mapred-site.xml.template /opt/hadoop/etc/hadoop/mapredsite.xml

编辑文件

#vi /opt/hadoop/etc/hadoop/mapred-site.xml

配置内容

<property>

  <name>mapreduce.framework.name</name>

  <value>yarn</value>

</property>

(5)创建数据文件

创建文件

#mkdir /opt/hadoop/hadoopdata

格式化文件系统

#hadoop namenode -format

8.设置SSH网络

(1)ssh-keygen免密登陆设置,输入命令键回车三次

生成免登入密匙 #ssh-keygen -t rsa

(2)为 master 发送免登入密匙 #ssh-copy-id -i ~/.ssh/id_rsa root@192.168.56.110

注意:输入 yes 回车 yes

输入密码 ,密码为xshell密码。

(3)ssh 连接 master

#ssh master

(4)直接输入 JavaJDK 物理路径

配置文件

# vi /opt/hadoop/etc/hadoop/hadoop-env.sh

内容为 JAVA 路径 :

export JAVA_HOME=/usr/local/java

9.启动Hadoop

(1)开启命令 #start-all.sh

停止命令 #stop-all.sh

(2)验证配置是否成功

查看 Hadoop 进程

# jps

(3)计算PI,看Hadoop是否运行的起

Hadoop 运行 jar 包命令

# hadoop jar /opt/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.5.j ar pi 10 10

10.多节点配置Hadoop

(1) 编辑文件

#vi /opt/hadoop/etc/hadoop/slaves

内容 :

slave1

slave2

(2)配置hosts主机文件

#vi /etc/hosts

添加内容

192.168.56.111 slave1

192.168.56.112 slave2

(3)虚拟机克隆IP地址

(4)修改克隆主机名

#slave1

NETWORKING=yes

HOSTNAME=slave1
 
#slave2

NETWORKING=yes

HOSTNAME=slave2
 
配置文件

#/etc/sysconfig/hostname

修改文件 slave1  
 
修改文件 slave2

(5)配置三台机子免密登陆

ssh-copy-id -i ~/.ssh/id_rsa root@master

ssh-copy-id -i ~/.ssh/id_rsa root@slave1

ssh-copy-id -i ~/.ssh/id_rsa root@slave2

 

---恢复内容结束---

xshell5运行hadoop集群的更多相关文章

  1. 沉淀,再出发——手把手教你使用VirtualBox搭建含有三个虚拟节点的Hadoop集群

    手把手教你使用VirtualBox搭建含有三个虚拟节点的Hadoop集群 一.准备,再出发 在项目启动之前,让我们看一下前面所做的工作.首先我们掌握了一些Linux的基本命令和重要的文件,其次我们学会 ...

  2. eclipse 远程链接访问hadoop 集群日志信息没有输出的问题l

    Eclipse插件Run on Hadoop没有用到hadoop集群节点的问题参考来源 http://f.dataguru.cn/thread-250980-1-1.html http://f.dat ...

  3. Hadoop集群(第6期)_WordCount运行详解

    1.MapReduce理论简介 1.1 MapReduce编程模型 MapReduce采用"分而治之"的思想,把对大规模数据集的操作,分发给一个主节点管理下的各个分节点共同完成,然 ...

  4. Hadoop集群运行JNI程序

    要在Hadoop集群运行上运行JNI程序,首先要在单机上调试程序直到可以正确运行JNI程序,之后移植到Hadoop集群就是水到渠成的事情. Hadoop运行程序的方式是通过jar包,所以我们需要将所有 ...

  5. hadoop集群的三种运行模式

    单机(本地)模式: 这种模式在一台单机上运行,没有分布式文件系统,而是直接读写本地操作系统的文件系统.在单机模式(standalone)中不会存在守护进程,所有东西都运行在一个JVM上.这里同样没有D ...

  6. 编写hadoop程序,并打包jar到hadoop集群运行

    windows环境下编写hadoop程序 新建:File->new->Project->Maven->next GroupId 和ArtifactId 随便写(还是建议规范点) ...

  7. Windows平台开发Mapreduce程序远程调用运行在Hadoop集群—Yarn调度引擎异常

    共享原因:虽然用一篇博文写问题感觉有点奢侈,但是搜索百度,相关文章太少了,苦苦探寻日志才找到解决方案. 遇到问题:在windows平台上开发的mapreduce程序,运行迟迟没有结果. Mapredu ...

  8. Hadoop集群WordCount运行详解(转)

    原文链接:Hadoop集群(第6期)_WordCount运行详解 1.MapReduce理论简介 1.1 MapReduce编程模型 MapReduce采用"分而治之"的思想,把对 ...

  9. [转]Hadoop集群_WordCount运行详解--MapReduce编程模型

    Hadoop集群_WordCount运行详解--MapReduce编程模型 下面这篇文章写得非常好,有利于初学mapreduce的入门 http://www.nosqldb.cn/1369099810 ...

随机推荐

  1. CPU 架构SMP/NUMA,调优

    CPU 架构SMP/NUMA,调优 SMP:全称是"对称多处理"(Symmetrical Multi-Processing)技术 . 是指在一个计算机上汇集了一组处理器(多CPU) ...

  2. 渗透测试学习 十七、 XSS跨站脚本漏洞详解

      一般用途:拿cookie进后台,将后台地址一起发送过来 特点:挖掘困难,绕过困难  大纲: XSS漏洞基础讲解 XSS漏洞发掘与绕过 XSS漏洞的综合利用 XSS漏洞基础讲解 XSS介绍: 跨站脚 ...

  3. grep: /usr/include/php/main/php.h: No such file or directory

    异常 grep: /usr/include/php/main/php.h: No such file or directory grep: /usr/include/php/Zend/zend_mod ...

  4. tensorflow的MNIST教程

    (ps:根据自己的理解,提炼了一下官方文档的内容,错误的地方希望大佬们多多指正.....) 0x01:数据集的获取和表示 数据集的获取,可以通过代码自动下载.这里的数据就是各种手写数字图片和图片对应的 ...

  5. mongodb的数据库,集合,数据可介绍。

    我们知道,在关系型数据库里面有数据库.数据表.表里面是一行一行的数据.而mongodb是非关系型数据库,它有的是数据库.集合.文档,分别对应关系型里面的数据库.数据表.和表里面一行一行的数据.在mon ...

  6. day59_9_25中间键与登录认证

    一.django中间件简介. 在django中,有这样的生命周期: 中间件就是处于wsgiref和urls模块中间,可以拦截所有的请求,其中有7个默认中间件: MIDDLEWARE = [ 'djan ...

  7. QQ小程序开发与发布小教程

    QQ小程序QQApp,和微信小程序类似,可以直接在手机QQ中直接打开,应用内应用,省去了安装手机APP,非常方便.官方的介绍:QQ小程序为QQ体系下的应用开放平台,可为不同类型的产品提供框架,并在QQ ...

  8. CloudCompare中对点云进行降采样和剪裁

    降采样: Edit=>Subsample 出现一个弹窗,可以选择3种降采样的方式:Random, Space, Octree. 下面用一个例子来说明3种方式.例子是一个5.88M个点的点云文件( ...

  9. luoguP4151 [WC2011]最大XOR和路径

    题意 这题有点神啊. 首先考虑注意这句话: 路径可以重复经过某些点或边,当一条边在路径中出现了多次时,其权值在计算 XOR 和时也要被计算相应多的次数 也就是说如果出现下面的情况: 我们可以通过异或上 ...

  10. SQL查询--简单了解SQL(结构化查询语言)

    以下内容是从其他地方摘抄过来的哈,原文地址忘记了,当时把内容记在了笔记中 SQL分类: 数据查询语言(DQL) 数据定义语言(DDL) 数据操纵语言(DML) 数据控制语言(DCL) 1.数据查询语言 ...