一些介绍

Hadoop 2和Hadoop 3的端口区别

Hadoop 3 HDFS集群架构

我的集群规划

name	ip	role
61	192.168.3.61	namenode, datanode
62	192.168.3.62	datanode
63	192.168.3.63	secondnamenode
64	192.168.3.64	datanode

1.安装JDK

利用FileZilla sftp功能进行上传到指定文件夹下/root/software,下图是配置sftp.

解压使用命令tar -xvzf jdk-8u241-linux-x64.tar.gz 解压到当前文件夹下。
配置环境变量，输入命令vim /etc/profile，添加

JAVA_HOME=/root/software/jdk1.8.0_241
PATH=$JAVA_HOME/bin:$PATH

最后退出vi,输入source /etc/profile
测试输入命令java -version,如果展示

root@localhost ~]# java -version
java version "1.8.0_241"
Java(TM) SE Runtime Environment (build 1.8.0_241-b07)
Java HotSpot(TM) 64-Bit Server VM (build 25.241-b07, mixed mode)
[root@localhost ~]#

安装成功！
ssh免密配置请查看

2.配置Hadoop

sftp://root@192.168.3.62/root/software/hadoop-3.2.1.tar.gz
解压。

2.1部署及配置

Hadoop的配置涉及以下几个文件，分别是：hadoop-env.sh、core-site.xml、hdfs-site.xml和workers。其中，hadoop-env.sh是Hadoop运行环境变量配置；core-site.xml是Hadoop公共属性的配置；hdfs-site.xml是关于HDFS的属性配置；workers是DataNode分布配置。下面我们分别配置这几个文件。
以61为中心配置，最后复制到其他服务器

hadoop-env.sh文件

在/etc/hadoop/hadoop-env.sh中配置运行环境变量，在默认情况下，这个文件是没有任何配置的。我们需要配置JAVA_HOME、HDFS_NAMENODE_USER和HDFS_DATANODE_USER等，HDFS_SECONDARYNAMENODE_USER配置代码如下：
在尾部加入

export JAVA_HOME=/root/software/jdk1.8.0_241
export  HDFS_NAMENODE_USER=root
export  HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root

其中，JAVA_HOME=/root/software/jdk1.8.0_241是指定JDK的位置，HDFS_NAMENODE_USER=root是指定操作NameNode进程的用户是root。同理，HDFS_DATANODE_USER和HDFS_SECONDARYNAMENODE_USER分别指定了操作DataNode和Secondary NameNode的用户，在这里我们设置为root用户，具体应用时，读者根据情况进行设置即可。在这里需要注意的是，HDFS_NAMENODE_USER、HDFS_DATANODE_USER和HDFS_SECONDARYNAMENODE_USER是Hadoop 3.x为了提升安全性而引入的。

core-site.xml文件

core-site.xml中主要配置Hadoop的公共属性，配置代码如下：

<configuration>
  <property>
        <name>fs.defaultFS</name>
        <value>hdfs://192.168.3.61:9820</value>
    </property>
<property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/hadoopdata</value>
    </property>
</configuration>

其中，fs.defaultFS是指定NameNode所在的节点，在这里配置为node1；9820是默认端口；hdfs：是协议；hadoop.tmp.dir是配置元数据所存放的配置，这里配置为/opt/hadoopdata，后续如果需要查看fsiamge和edits文件，可以到这个目录下查找。

hdfs-site.xml文件

hdfs-site.xml文件中主要是HDFS属性配置，配置代码如下：

<configuration>
<property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>192.168.3.63:9868</value>
    </property>
<property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
<property>
 <name>dfs.namenode.datanode.registration.ip-hostname-check</name>
 <value>false</value>
</property>

其中，dfs.namenode.secondary.http-address属性是配置Secondary NameNode的节点，在这里配置为node2。端口为9868。
关于这些配置，读者可以从官网上查找，网址为https://hadoop.apache.org/docs/stable/index.html，其中的左下角有个Configuration项，其中包括core-default.xml等配置文件。

workers文件

在workers中配DataNode节点，在其中写入：

192.168.3.61
192.168.3.62
192.168.3.64

2.2 将配置复制到其他服务器

进入 /root/software/hadoop-3.2.1/etc 目录
输入命令

scp  -r ./hadoop   192.168.3.62:/root/software/hadoop-3.2.1/etc/
 scp  -r ./hadoop   192.168.3.63:/root/software/hadoop-3.2.1/etc/
 scp  -r ./hadoop   192.168.3.64:/root/software/hadoop-3.2.1/etc/

2.3配置下hadoop的环境变量，方便输入命令

export JAVA_HOME=/root/software/jdk1.8.0_241
export HADOOP_HOME=/root/software/hadoop-3.2.1
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

2.4格式化

第一次安装Hadoop需要进行格式化，以后就不需要了。格式化命令在hadoop/bin下面，执行如下命令：

hdfs namenode -formate

格式化后会创建一个空白的fsimage文件，可以在opt/hadoopdata/dfs/name/current中找到fsimage文件，注意此时没有edits文件。

3.启动

进入hadoop/sbin下面运行start-dfs.sh，启动HDFS集群，启动命令如下：

./start-dfs.sh

这时，可以在不同节点中通过jps命令查看不同的进程。
61

62

63

64

表示都已经启动。

4.打开浏览器查看HDFS监听页面

在浏览器中输入http://ip:9870，比如这里输入http://192.168.30.61:9870/，出现以下界面则表示Hadoop完全分布式搭建成功

选择Datanodes选项，可以看到DataNode的利用率和DataNode的节点状态

这里只显示了一个比较奇怪，以后再研究。

更多精彩请关注公众号【lovepythoncn】

hadoop3自学入门笔记(2)—— HDFS分布式搭建的更多相关文章

hadoop3自学入门笔记(3)-java 操作hdfs
1.core-site.xml <configuration> <property> <name>fs.defaultFS</name> <val ...
hadoop3自学入门笔记(1)——虚拟机安装和网络配置
前言年过30惶惶不安,又逢疫情,还是不断学习,强化自己的能力.hadoop的视频和书籍在15年的时候就看过,但是一直没动手实践过,要知道技术不经过实战,一点提升也没有.因此下定决心边学边做,希望能有 ...
Hadoop 笔记1 (原理和HDFS分布式搭建)
1. hadoop 是什么以及解决的问题 (自行百度) 2.基本概念的讲解 1. NodeName master 节点(NN) 主节点保存了metaData(元数据信息) 包括文件的owener ...
vue自学入门-1（Windows下搭建vue环境）
本人是一个喜欢动手的程序员,先跑起来个HelloWorld,增加感性认识,这三篇入门文章,花了不到一个小时,从网上找资料,程序跑通后,整理出来的,有的新人可能去哪找资料,运行代码都不知道,分享出来,大 ...
吴裕雄--天生自然HADOOP操作实验学习笔记：hdfs分布式文件系统安装
实验目的复习安装jdk 学习免密码登录掌握安装配置hdfs集群的方法掌握hdfs集群的简单使用和检查其工作状态实验原理 1.hdfs是什么 hadoop安装的第一部分是安装hdfs,hdfs是 ...
vue自学入门-6（vue jsx）
目录: vue自学入门-1(Windows下搭建vue环境) vue自学入门-2(vue创建项目) vue自学入门-3(vue第一个例子) vue自学入门-4(vue slot) vue自学入门-5( ...
vue自学入门-4（vue slot）
vue自学入门-1(Windows下搭建vue环境) vue自学入门-2(vue创建项目) vue自学入门-3(vue第一个例子) vue自学入门-4(vue slot) vue自学入门-5(vuex ...
vue自学入门-5（vuex state）
vue自学入门-1(Windows下搭建vue环境) vue自学入门-2(vue创建项目) vue自学入门-3(vue第一个例子) vue自学入门-4(vue slot) vue自学入门-5(vuex ...
vue自学入门-7（vue style scope）
vue自学入门-1(Windows下搭建vue环境) vue自学入门-2(vue创建项目) vue自学入门-3(vue第一个例子) vue自学入门-4(vue slot) vue自学入门-5(vuex ...

随机推荐

Docker windows nanoserver/mysql镜像root用户密码错误
由于需要在Windows server上的Docker中部署mysql服务,为了方便起见所以在Docker hub找到了nanoserver/mysql (https://hub.docker.com ...
Java中SMB的相关应用
目录 SMB 服务操作 Ⅰ SMB简介 Ⅱ SMB配置 2.1 Windows SMB Ⅲ 添加SMB依赖 Ⅳ 路径格式 Ⅴ 操作共享 Ⅵ 登录验证 SMB 服务操作 Ⅰ SMB简介 SMB(全称 ...
个人第四次作业：Alpha项目测试
个人第四次作业:Alpha项目测试格式描述详情这个作业属于哪个课程 http://edu.cnblogs.com/campus/xnsy/GeographicInformationScience ...
c#数字图像处理（十）图像缩放
图像几何变换(缩放.旋转)中的常用的插值算法在图像几何变换的过程中,常用的插值方法有最邻近插值(近邻取样法).双线性内插值和三次卷积法. 最邻近插值: 这是一种最为简单的插值方法,在图像中最小的单位 ...
解决Android studio遇见Could not find common.jar (android.arch.core:common:1.0.0).错误
不知道怎么回事就发生的错误,翻墙找到的解决方法,如下: Error:Could not find common.jar (android.arch.core:common:1.0.0).Searche ...
Cassandra2.2.10安装过程
1. 2.安装JVM 3.OS环境配置: 关闭防火墙:service iptables stop vi /etc/sysctl.conf vm.zone_reclaim_mode=0 vm.max_m ...
laravel 事件机制实践总结
laravel 事件机制实践总结观察者模式在EventServiceProvider的linsten数组里面加上事件和监听器,键名是事件,键值里面的数组是一个或者多个监听器, protected ...
PYTHON经典算法-二叉树的后序遍历
二叉树的后序遍历问题描述给出一个二叉树,返回其节点值的后序遍历问题示例给出一个二叉树{1,x,2,3}其中x表示空.后序遍历为[3,2,1] 这个图怎么画的呢?答案需要注意的地方是:bina ...
K8S提示Init:ImagePullBackOff
[root@master opt]# kubectl get pods -n kube-system NAME READY STATUS RESTARTS AGE coredns-9d85f5447- ...
angular之模块开发一
模块化开发概述什么是模块化开发将软件产品看作为一系列功能模块的组合通过特定的方式实现软件所需模块的划分.管理.加载为什么使用模块化开发 https://github.com/seajs/se ...

hadoop3自学入门笔记(2)—— HDFS分布式搭建