hadoop(三)伪分布模式hdfs文件处理|5

狂奔小蜗牛 2024-08-25 23:47:09 原文

伪分布模式hdfs

1.启动hsfs

2. 编辑vi hadoop-env.sh

image.png

image.png

3.配置nameNode和生产文件第地址

[shaozhiqi@hadoop101 hadoop]$ vi core-site.xml

指定HDFS中NameNode的地址

<configuration>

  <property>

  <name>fs.defaultFS</name>

  <value>hdfs://hadoop101:9000</value>

  </property>

  <!--指定hadoop运行时产生的临时文件存储的目录-->

  <property>

  <name>hadoop.tmp.dir</name>

  <value>/opt/module/hadoop-3.1.2/data/tmp</value>

  </property>

</configuration>

4.指定HDFS的副本数

[shaozhiqi@hadoop101 hadoop]$ vi hdfs-site.xml

<property>

 <name>dfs.replication</name>

 <value>1</value>

</property>

只有一个节点的话相同数据只存放一份，配置三没用，照样存储一份

启动hdfs

1. 格式化nameNode

hdfs namenode –format //生成name的工作空间

image.png

可以看到data文件夹已被创建

image.png

查看version可以看到我们的namenode id和集群id已生成

namespaceID=942797111

clusterID=CID-b853720f-e038-4541-a038-bb78bb01452a

image.png

2. 启动

查看hadoop有哪些命令

image.png

hadoop-daemon.sh  //是hadoop单节点守护进程的命令

3. 启动namenodeh

hadoop-daemon.sh start namenode

image.png

查看是否启动成功
Jsp是jdk提供的java的查看哪些java进程（linux是ps -ef）

image.png

如图启动成功
查看namenode web页面
192.168.1.101:9870（3.x+版本），旧版本的端口是50070
如果无法访问查看防火墙是否开启，若是开启就将它关闭：

[shaozhiqi@hadoop101 hadoop-3.1.2]$ systemctl stop firewalld.service

image.png

4. 启动datenode

[shaozhiqi@hadoop101 hadoop-3.1.2]$ hadoop-daemon.sh start datanode

<div align="right">

image.png

</div>
查看web端

image.png

查看data目录返现多了一个data,之前只有name

image.png

可以看到namenode和datanode时同一个集群
<font color="red">注意：</font>
我们重新个数话namenode时得删除date目录还有logs,否则集群起不来

image.png

并列的logs

Logs目录

通过刚刚的一系列操作我们生成了data和logs
查看logs目录发现有datanode和namenode的日志

image.png

执行wordcount

在hdfs文件系统上创建输入文件input

[shaozhiqi@hadoop101 hadoop-3.1.2]$ hdfs dfs -mkdir -p /user/shaohadoop/input

这个目录会创建在我们hdfs文件系统上，不是centos的本地路径。

image.png

将之前我们的wc.input 上传到我们的hdfs的input下

[shaozhiqi@hadoop101 hadoop-3.1.2]$ hdfs dfs -put wcinput/wc.input /user/shaohadoop/input

image.png

image.png

执行我们的wordcont

[shaozhiqi@hadoop101 hadoop-3.1.2]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.2.jar wordcount /user/shaohadoop/input user/shaohadoop/output

输入路径我们可以用hdfs自定义，但是输出路径自动加了usershaozhiqi,还不太懂

image.png

点击part-r 00000,下载后可以看到运行成功

image.png

hadoop(三)伪分布模式hdfs文件处理|5的更多相关文章

Hadoop单点伪分布模式安装
Hadoop单点伪分布模式安装概述单点 single-node,单节点,即一台计算机. 伪分布式模式 pseudo-distributed mode 所谓集群,表面上看是多台计算机联合完成任务:但 ...
【Hadoop】二、HDFS文件读写流程
(二)HDFS数据流作为一个文件系统,文件的读和写是最基本的需求,这一部分我们来了解客户端是如何与HDFS进行交互的,也就是客户端与HDFS,以及构成HDFS的两类节点(namenode和dat ...
hadoop fs:du统计hdfs文件（目录下文件）大小的用法
hadoop fs 更多用法,请参考官网:http://hadoop.apache.org/docs/r1.0.4/cn/hdfs_shell.html 以下是我的使用统计文件时使用的记录: [t@d ...
eclipse hadoop环境搭建查看HDFS文件内容
1.下载插件 hadoop-eclipse-plugin-2.5.2.jar放入eclipse/plugin 2.准备hadoop-2.5.0-cdh5.3.6 使用WinSCP远程连接虚拟机,复制h ...
Hadoop伪分布模式配置部署
.实验环境说明注意:本实验需要按照上一节单机模式部署后继续进行操作 1. 环境登录无需密码自动登录,系统用户名 shiyanlou,密码 shiyanlou 2. 环境介绍本实验环境采用带桌面的 ...
hadoop的安装和配置（二）伪分布模式
博主会用三篇文章为大家详细的说明hadoop的三种模式: 本地模式伪分布模式完全分布模式伪分布式模式: 这篇为大家带来hadoop的伪分布模式: 从最简单的方面来说,伪分布模式就是在本地模式上修 ...
Ubuntu上搭建Hadoop环境（单机模式+伪分布模式）
首先要了解一下Hadoop的运行模式: 单机模式(standalone) 单机模式是Hadoop的默认模式.当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选 ...
3-2 Hadoop集群伪分布模式配置部署
Hadoop伪分布模式配置部署一.实验介绍 1.1 实验内容 hadoop配置文件介绍及修改 hdfs格式化启动hadoop进程,验证安装 1.2 实验知识点 hadoop核心配置文件文件系统的 ...
Ubuntu上搭建Hadoop环境（单机模式+伪分布模式） (转载)
Hadoop在处理海量数据分析方面具有独天优势.今天花了在自己的Linux上搭建了伪分布模式,期间经历很多曲折,现在将经验总结如下. 首先,了解Hadoop的三种安装模式: 1. 单机模式. 单机模式 ...

随机推荐

docker redis安装及配置(外网访问关闭安全限制设置密码)
docker run -p 6379:6379 --name redis -v /usr/local/redis/etc/redis.conf:/etc/redis/redis.conf -v /us ...
Linux 部署Tomcat图文注解一学就会
导读安装tomcat前首先要安装对应的jdk并配置Java环境. 安装jdk,请参考:点我直达安装Tomcat 下载Tomcat包官网地址:点我直达 Tomcat与jdk兼容关系注:Tomca ...
Linux & Shell 学习笔记【1/2】
因为工作上的需要,花了些许时间去熟悉学习Linux和Shell,现在也花点事件在此记录一下以加强巩固学习的内容吧.学的不算深入,所以都是一些比较junior的内容. 在下一篇随笔会详述之前写的一个用于 ...
adb软件国产安卓手机对系统的把控
国产安卓手机对系统的把控,现在想搞机的方法是愈来愈麻烦,华为最先的申请解锁码,到现在直接系统锁死不给解.让我等搞机小伙伴是望机兴叹.安卓手机的通病随着系统升级,手机就越来越卡.本想通过卸载系统自带应用 ...
线段树（区间合并）HDU - 1540
题意:输入n,m,给定n个相互连通的村庄,有m个操作,D x,表示破坏x村庄使其与相邻的两个村庄不相通,R 表示修复上一个被破坏的村庄,与相邻的两个村庄联通.Q x表示与x相连的村庄有多少个. 思路: ...
poj——1182食物链并查集（提升版）
因为是中文题,题意就不说了,直接说思路: 我们不知道给的说法中的动物属于A B C哪一类,所以我们可以用不同区间的数字表示这几类动物,这并不影响结果,我们可以用并查集把属于一类的动物放在一块,举个例子 ...
三层架构——ATM + 购物车
三层架构:用户视图层.逻辑接口层.数据处理层. 一个功能,分成三层架构写,增加程序的可扩展性. 三层是互有联系的,从用户视图层开始写,涉及到那一层就到下一层去写,然后return 返回值,再写回来. ...
Fedora20在神州战神K650D1安装过程，使用netinstall和Dvd.iso镜像安装。
最近新买一笔记本,神州战神K650D-i5 D1.仍旧安装双系统,WIndows7+Fedora20.磁盘分区是这样的: 第一主分区 /boot ext4 20G 第二主分区 / ext4 70G 第 ...
类加载机制之ClassLoader
1,类加载每个编写的”.java”拓展名类文件都存储着需要执行的程序逻辑,这些”.java”文件经过Java编译器编译成拓展名为”.class”的文件,”.class”文件中保存着Java代码经转换 ...
Django安装和使用
Django安装安装Django Python3在线安装Django pip3 install Django 验证是否安装成功,并查看当前版本 python -m django --version ...