Hadoop 安装流程

前言：因项目中需要数据分析，因而使用hadoop集群通过离线的方式分析数据

参考着网上的分享的文章实施整合的一篇文章，实施记录

安装流程：

1.设置各个机器建的ssh 无密码登陆

2.安装JDK

3.开始安装配置hadoop

4.检查单机版Hadoop

5.集群搭建

6.测试集群是否搭建成功

7.hadoop远程客户端安装配置

准备：分别上台机器：master(hadoop主机)、node1（hadoop从机）、node2（hadoop从机）

echo "192.168.163.220 master" >>/etc/hosts
echo "192.168.163.48 node1" >>/etc/hosts
echo "192.168.163.55 node2" >>/etc/hosts

1.设置各个机器建的ssh 无密码登陆

(1)CentOS默认没有启动ssh无密登录，去掉/etc/ssh/sshd_config其中2行的注释，每台服务器都要设置，
#RSAAuthentication yes
#PubkeyAuthentication yes
(2)输入命令，ssh-keygen -t rsa，生成key，都不输入密码，一直回车，/root就会生成.ssh文件夹，每台服务器都要设置，
(3)合并公钥到authorized_keys文件，在Master服务器，进入/root/.ssh目录，通过SSH命令合并，
cat id_rsa.pub>> authorized_keys
ssh root@node1 cat ~/.ssh/id_rsa.pub>> authorized_keys
ssh root@cli cat ~/.ssh/id_rsa.pub>> authorized_keys
(4)把Master服务器的authorized_keys、known_hosts复制到Slave服务器的/root/.ssh目录
(5)完成，ssh root@192.168.0.84、ssh root@192.168.0.48就不需要输入密码了

2.安装JDK

(1)安装包中已经下载好了 rpm 格式的jdk安装包

· 安装之前先检查一下系统有没有自带open-jdk

· 图片上显示我的是没有自带的，如果有可以使用rpm -qa | grep java | xargs rpm -e --nodeps 批量卸载所有带有Java的文件这句命令的关键字是java

(2)使用rpm -ivh jdk-8u45-linux-x64.rpm进行安装（每一台机器都需要安装配置）

(3)配置环境变量使用命令 vim /etc/profile

rpm -ivh jdk-8u45-linux-x64.rpm

配置 /etc/profile

export JAVA_HOME=/usr/java/jdk1.8.0_45

export HADOOP_HOME=/hadoop/hadoop-2.7.2

export HIVE_HOME=/hadoop/apache-hive-2.1.0-bin

export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$HIVE_HOME/lib

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$HIVE_HOME/bin

(4)验证使用安装以及环境变量设置成功使用命令

[root@localhost ~]# source /etc/profile

[root@localhost ~]# java -version

3.开始安装配置hadoop

(1)将hadoop-2.7.2.tar.gz 文件放在 /hadoop 目录下，解压文件执行命令

[root@localhost ~]# cd /hadoop

[root@master hadoop]# tar -vxzf hadoop-2.7.2.tar.gz

(2)修改配置文件

a.修改/hadoop/hadoop-2.7.2/etc/hadoop/core-site.xml 全局配置

<name>fs.defaultFS</name>

<value>hdfs://master:9000</value>

</property>

<name>dfs.namenode.checkpoint.period</name>

</property>

<name>fs.checkpoint.size</name>

</property>

<name>fs.trash.interval</name>

</property>

<name>hadoop.tmp.dir</name>

<value>/hadoop/tmp</value>

</property>

<name>io.file.buffer.size</name>

</property>

b.修改/hadoop/hadoop-2.7.2/etc/hadoop/hdfs-site.xml hdfs中NameNode,DataNode局部配置

<name>dfs.namenode.name.dir</name>

<value>/hadoop/hdfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>/hadoop/hdfs/data</value>

</property>

<name>dfs.namenode.http-address</name>

<value>master:50070</value>

</property>

<name>dfs.namenode.secondary.http-address</name>

</property>

<name>dfs.webhdfs.enabled</name>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.datanode.du.reserved</name>

</property>

<name>dfs.block.size</name>

</property>

<name>dfs.permissions.enabled</name>

<value>false</value>

</property>

c.修改 hadoop/hadoop-2.7.2/etc/hadoop/mapred-site.xml.template #配置MapReduce，使用yarn框架、jobhistory使用地址以及web地址

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobtracker.http.address</name>

<value>master:50030</value>

</property>

<name>mapred.job.tracker</name>

<value>http://master:9001</value>

</property>

<name>mapreduce.jobhistory.address</name>

<value>master:10020</value>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>master:19888</value>

</property>

配置完毕以后执行命令

[root@master hadoop]# cp mapred-site.xml.template mapred-site.xml

d.修改 hadoop/hadoop-2.7.2/etc/hadoop/yarn-site.xml 配置yarn-site.xml文件

<name>mapreduce.framework.name</name>

</property>

<name>yarn.resourcemanager.address</name>

<value>master:8032</value>

</property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>master:8030</value>

</property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>master:8031</value>

</property>

<name>yarn.resourcemanager.admin.address</name>

<value>master:8033</value>

</property>

<name>yarn.resourcemanager.webapp.address</name>

<value>master:8088</value>

</property>

e. 修改 hadoop/hadoop-2.7.2/etc/hadoop/ hadoop-env.sh及vi yarn-env.sh

将其中的${JAVA_HOME}用/usr/jdk1.7.0_79代替

export JAVA_HOME=/usr/java/jdk1.8.0_45

f.创建目录上面所配置的路径

[root@master ~]# mkdir -p /hadoop/tmp

[root@master ~]# mkdir -p /hadoop/hdfs/name

[root@master ~]# mkdir -p /hadoop/hdfs/data

f. 修改$HADOOP_HOME/etc/hadoop/yarn.site.xml, 此项配置是为配置 hive

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

4.检查单机版Hadoop

测试hdfs中的namenode与datanode：
hadoop-daemon.sh start namenode
chmod go-w /data/hadoop/hdfs/data/
hadoop-daemon.sh start datanode

测试resourcemanager：
yarn-daemon.sh start resourcemanager

测试nodemanager：
yarn-daemon.sh start nodemanager

测试historyserver：
mr-jobhistory-daemon.sh start historyserver

[root@master hadoop-2.7.2]# jps

6116 NodeManager

6901 NameNode

5704 ResourceManager

6204 JobHistoryServer

5518 DataNode

6974 Jps

[root@master hadoop-2.7.2]# hadoop fs -lsr /

5.集群搭建

scp -r $HADOOP_HOME/ node1:/hadoop/

在master 上配置

[root@master hadoop-2.7.2]# vim $HADOOP_HOME/etc/hadoop/slaves

删除localhost

添加 node1

6.测试集群是否搭建成功

在Master服务器启动hadoop，从节点会自动启动，进/hadoop/hadoop-2.7.2目录
(1)初始化，输入命令，bin/hdfs namenode -format
(2)全部启动sbin/start-all.sh，也可以分开sbin/start-dfs.sh、sbin/start-yarn.sh
(3)停止的话，输入命令，sbin/stop-all.sh
(4)输入命令，jps，可以看到相关信息

Web访问，要先开放端口或者直接关闭防火墙
(1)输入命令，systemctl stop firewalld.service
(2)浏览器打开http://192.168.0.182:8088/
(3)浏览器打开http://192.168.0.182:50070/

各节点执行jps
master：
98956 JobHistoryServer

98820 NodeManager

118806 Jps

118176 NameNode

118540 ResourceManager

node1：
106602 Jps

106301 DataNode

106496 NodeManager

106408 SecondaryNameNode

7.hadoop远程客户端安装配置

a.配置 /etc/profile 的环境变量配置java和hadoop （可参考第二点配置JDK）

b.hadoop 配置文件修改

在客户端只需配置集群namenode 和 jobtracker 的相关信息,以及java安装目录。即修改conf目录下文件：

hadoop-env.sh：

export JAVA_HOME=/usr/java/jdk1.8.0_45

core-site.xml:

<name>fs.defaultFS</name>

<value>hdfs://master:9000</value>

</property>

mapred-site.xml:

<name>mapred.job.tracker</name>

<value>http://master:9001</value>

</property>

cp etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml

c.现在hadoop客户端已经配置好，可以运行基本的命令如：

hadoop fs -lsr /

这样就搭建了一个基本的集群了，接下来使用hive分析历史数据

Hadoop 安装流程的更多相关文章

五十九.大数据、Hadoop 、 Hadoop安装与配置、 HDFS
1.安装Hadoop 单机模式安装Hadoop 安装JAVA环境设置环境变量,启动运行 1.1 环境准备 1)配置主机名为nn01,ip为192.168.1.21,配置yum源(系统源) 备 ...
Linux环境Hadoop安装配置
Linux环境Hadoop安装配置 1. 准备工作 (1)linux配置IP(NAT模式) (2)linux关闭防火墙 (3)设置主机名 (4)设置映射 (5)设置免密登录 2. 安装jdk (1)上 ...
iOS 最新版 CocoaPods 的安装流程
iOS 最新版 CocoaPods 的安装流程1.移除现有Ruby默认源$gem sources --remove https://rubygems.org/2.使用新的源$gem sources - ...
最新版 CocoaPods 的安装流程
iOS 最新版 CocoaPods 的安装流程 1.移除现有Ruby默认源 $gem sources --remove h ...
linux hadoop安装
linux hadoop安装本文介绍如何在Linux下安装伪分布式的hadoop开发环境. 在一开始想利用cgywin在 windows下在哪, 但是一直卡在ssh的安装上.所以最后换位虚拟机+ub ...
CocoaPods安装流程
iOS 最新版 CocoaPods 的安装流程 1.移除现有Ruby默认源 $gem sources --remove https://rubygems.org/ 2.使用新的源 $g ...
CentOS 7 64位的安装流程
若出现以下不支持虚拟机的问题: 表示虚拟机检测到CPU支不支持虚拟化,要去BIOS里设置虚拟化技术设置为enabled:重启电脑-按"F1或Fn+F1"-进入BIOS主界面-移至S ...
转载：Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04
原文 http://www.powerxing.com/install-hadoop/ 当开始着手实践 Hadoop 时,安装 Hadoop 往往会成为新手的一道门槛.尽管安装其实很简单,书上有写到, ...
hadoop安装遇到的各种异常及解决办法
hadoop安装遇到的各种异常及解决办法异常一: 2014-03-13 11:10:23,665 INFO org.apache.hadoop.ipc.Client: Retrying connec ...

随机推荐

Java导出freemarker实现下载word文档格式功能
首先呢,先说一下制作freemarker模板步骤, 1. 在WPS上写出所要的下载的word格式当做模板 2. 把模板内不固定的内容(例:从数据库读取的信息)写成123或者好代替的文字标注 3. 把固 ...
MySql全国省市区SQL语句
CREATE TABLE IF NOT EXISTS `province` ( `id` int(11) NOT NULL auto_increment, `provinceID` int(1 ...
Mysql主从复制_模式之日志点复制
MySQL数据复制的原理 MySQL复制基于主服务器在二进制日志中跟踪所有对数据库的更改(更新.删除等等).因此,要进行复制,必须在主服务器上启用二进制日志. 每个从服务器从主服务器接收主服务器已经记 ...
OpenCV 之空间滤波
1 空间滤波 1.1 基本概念空间域,在图像处理中,指的是像平面本身: 空间滤波,则是在像平面内,对像素值所进行的滤波处理. 如上图所示,假设点 (x, y) 为图像 f 中的任意点,中间正方形 ...
Java NIO之缓冲区
1.简介 Java NIO 相关类在 JDK 1.4 中被引入,用于提高 I/O 的效率.Java NIO 包含了很多东西,但核心的东西不外乎 Buffer.Channel 和 Selector.这其 ...
Docker系列二：Docker的基本结构
Docker的基本结构 Docker 的三大基础组件 Docker有三个重要的概念:仓库 , 镜像和容器 ,它们是Docker的三大基出组件 Docker的组织结构 Docker处于操作系统和虚拟 ...
2015最新iOS学习线路图
iOS是由苹果公司开发的移动操作系统,以xcode为主要开发工具,具有简单易用的界面.令人惊叹的功能,以及超强的稳定性,已经成为iPhone.iPad 和iPod touch 的强大基础:iOS 内置 ...
python基础数据类型判断语句
python 类unix系统默认已经安装或使用源码包./confighuremakemake install python运行方法通过交互式解释器 [root@room1pc01 ~]# pytho ...
R实战第三篇：数据处理（基础）
数据结构用于存储数据,不同的数据结构对应不同的操作方法,对应不同的分析目的,应选择合适的数据结构.在处理数据时,为了便于检查数据对象,可以通过函数attributes(x)来查看数据对象的属性,str ...
SQL Server使用侦听器IP访问时遇到"The target principal name is incorrect. Cannot generate SSPI context"
在测试SQL Server 2016 Always On时,在创建侦听器后,在客户端使用SSMS, 可以用侦听器名称访问Always On集群,但是使用侦听器IP访问时遇到"The targ ...

Hadoop 安装流程

Hadoop 安装流程的更多相关文章

随机推荐

热门专题