大数据：Hadoop（JDK安装、HDFS伪分布式环境搭建、HDFS 的shell操作）

所有的内容都来源与 Hadoop 官方文档

一、Hadoop 伪分布式安装步骤

　1）JDK安装

解压：tar -zxvf jdk-7u79-linux-x64.tar.gz -C ~/app

添加到系统环境变量：

~/.bash_profile
export JAVA_HOME=/home/hadoop/app/jdk1.7.0_79
export PATH=$TAVA_HOME/bin:$PATH

环境变量生效：source ~/bash_profile

验证Java是否配置成功：java -v

　2）ssh安装

参考：远程连接SSH

二、HDFS伪分布式环境搭建

　1）下载并解压hadoop

下载：cdh网站下载
解压：tar -zxvf hadoop-2.6.0-cdh5.7.0.tar.gz -C ~/app

　2）修改 Hadoop 配置文件

在 hadoop_home/etc/hadoop 目录下修改
配置 hadoop-env.sh 文件

配置：export JAVA_HOME=/home/hadoop/app/jdk1.7.0_79

配置 cor-site.xml 及 hdfs-site.xml 文件
cor-site.xml 中，默认的数据存放在临时文件夹，需要添加新的属性（hadoop.tmp.dir），可以指定存放的文件夹（如存放在文件夹 /home/hadoop/app 中），防止数据在每次重启系统时被删除；

配置 slaves 文件：用于添加素有 DataNode 的名字；

　3）启动 hdfs

格式化文件系统（在客户端操作，且仅第一次执行即可，不要重复执行）：hdfs namenode -format，或者 hadoop namenode -format
启动 hdfs：（sbin 目录下）sbin/start-dfs.sh
验证是否启动成功：

3 个进程，如果缺少，说明缺少的部分配置不成功；（可通过日志输出查看进程的启动过程）

浏览器访问方式：http://localhost:50070

　4）停止 hdfs

（在 sbin 目录下）sbin/stop-dfs.sh

三、HDFS 的shell 操作

hdfs dfs + commands 或者 hadoop fs + commands
用法与 Linux 命令相同

例：

hadoop fs -put hello.txt：将文件 hello.txt 从本地传到 HDFS 上；
hadoop fs -get hello.txt：从 HDFS 上获取文件 hello.txt 到本地；
hadoop fs -text /hello.txt：查看文件 hello.txt 的内容；
hadoop fs -mkdir /test：在 HDFS 上创建一个目录 test；
hadoop fs -mkdir -p /test/a/b：在 HDFS 上创建递归文件夹；
hadoop fs -rm /hello.txt：删除一个文件；（-rm 不能删除文件夹，只能删除文件）
hadoop fs -rm -R /test：删除文件夹 test 及其下所有递归文件；
hadoop fs -ls -R：查看递归文件夹；

大数据：Hadoop（JDK安装、HDFS伪分布式环境搭建、HDFS 的shell操作）的更多相关文章

HDFS 伪分布式环境搭建
HDFS 伪分布式环境搭建作者:Grey 原文地址: 博客园:HDFS 伪分布式环境搭建 CSDN:HDFS 伪分布式环境搭建相关软件版本 Hadoop 2.6.5 CentOS 7 Oracle ...
HDFS伪分布式环境搭建
(一).HDFS shell操作以上已经介绍了如何搭建伪分布式的Hadoop,既然环境已经搭建起来了,那要怎么去操作呢?这就是本节将要介绍的内容: HDFS自带有一些shell命令,通过这些命令我们 ...
大数据hadoop入门学习之集群环境搭建集合
目录: 1.基本工作准备 1.虚拟机准备 2.java 虚拟机-jdk环境配置 3.ssh无密码登录 2.hadoop的安装与配置 3.hbase安装与配置(集成安装zookeeper) 4.zook ...
Hadoop学习笔记1：伪分布式环境搭建
在搭建Hadoop环境之前,请先阅读如下博文,把搭建Hadoop环境之前的准备工作做好,博文如下: 1.CentOS 6.7下安装JDK , 地址: http://blog.csdn.net/yule ...
Hadoop 2.7 伪分布式环境搭建
1.安装环境 ①.一台Linux CentOS6.7 系统 hostname ipaddress subnet mask ...
【Hadoop】伪分布式环境搭建、验证
Hadoop伪分布式环境搭建: 自动部署脚本: #!/bin/bash set -eux export APP_PATH=/opt/applications export APP_NAME=Ares ...
CentOS7下Hadoop伪分布式环境搭建
CentOS7下Hadoop伪分布式环境搭建前期准备 1.配置hostname(可选,了解) 在CentOS中,有三种定义的主机名:静态的(static),瞬态的(transient),和灵活的(p ...
【Hadoop离线基础总结】CDH版本Hadoop 伪分布式环境搭建
CDH版本Hadoop 伪分布式环境搭建服务规划步骤第一步:上传压缩包并解压 cd /export/softwares/ tar -zxvf hadoop-2.6.0-cdh5.14.0.tar ...
Hadoop2.5.0伪分布式环境搭建
本章主要介绍下在Linux系统下的Hadoop2.5.0伪分布式环境搭建步骤.首先要搭建Hadoop伪分布式环境,需要完成一些前置依赖工作,包括创建用户.安装JDK.关闭防火墙等. 一.创建hadoo ...

随机推荐

shell 字符串拼接
#!/bin/bash name="Shell" url="http://c.biancheng.net/shell/" str1=$name$url #中间不 ...
微信小程序跳转函数总结
微信小程序跳转函数总结笔者在微信小程序前端的开发过程中,在不同的情况下遇到了需要使用不同的页面跳转逻辑的情况,以下是我对这些函数的使用场景的一个总结介绍. wx.navigateTo 这是最常用 ...
【数据结构】【计算机视觉】并查集(disjoint set)结构介绍
1.简述在实现多图像无序输入的拼接中,我们先使用surf算法对任意两幅图像进行特征点匹配,每对图像的匹配都有一个置信度confidence参数,来衡量两幅图匹配的可信度,当confidence> ...
spark listener
最近在做一个需求,当spark程序在读数据或写数据时,将所读的条数或或所写的条数实时的展现出来,这里用到了SparkListener,sparklisten 可以获取spark 各个运行阶段的状态. ...
关于JavaSE程序的小总结（不分先后顺序后续继续补充）
统计字符串中某个字符串出现的次数 package com.jiang.demo01; public class Demo01 { public static void main(String[] ar ...
一文让你彻底理解准确率，精准率，召回率，真正率，假正率，ROC/AUC
参考资料:https://zhuanlan.zhihu.com/p/46714763 ROC/AUC作为机器学习的评估指标非常重要,也是面试中经常出现的问题(80%都会问到).其实,理解它并不是非常难 ...
vs中使用tfs创建项目
1.打开“Team Explorer”,点击“Home”,选择"Project"->"New Team Project",操作如下图: 2.输入项目名称. ...
洛谷P5524：[Ynoi2012]D1T1——题解
https://www.luogu.org/problem/P5524 看着能做就当线段树复健题了. 根据高中知识我们有 $sin(a+b)=sin(a)cos(b)+cos(a)sin(b)$ $c ...
Python 3 + Selenium 3 实现汉堡王客户调查提交
用Python 3 + Selenium 3实现汉堡王客户调查的自动填写,可以用来作为 python selenium的入门学习实现脚本,列举了几个比较不太好弄的知识点. 上代码: from sele ...
【题解】Luogu P5327 [ZJOI2019]语言
原题传送门看到这种树上统计点对个数的题一般是线段树合并,这题也不出意外先对这棵树进行树剖,对于每次普及语言,在$x,y$两点的线段树上的$x,y$两位置打$+1$标记,在点\(fa[l ...

大数据：Hadoop（JDK安装、HDFS伪分布式环境搭建、HDFS 的shell操作）

所有的内容都来源与 Hadoop 官方文档

一、Hadoop 伪分布式安装步骤

1）JDK安装

2）ssh安装

二、HDFS伪分布式环境搭建

1）下载并解压hadoop

2）修改 Hadoop 配置文件

配置 hadoop-env.sh 文件

配置 cor-site.xml 及 hdfs-site.xml 文件

配置 slaves 文件：用于添加素有 DataNode 的名字；

3）启动 hdfs

4）停止 hdfs

三、HDFS 的shell 操作

例：

大数据：Hadoop（JDK安装、HDFS伪分布式环境搭建、HDFS 的shell操作）的更多相关文章

随机推荐

热门专题

　1）JDK安装

　2）ssh安装

　1）下载并解压hadoop

　2）修改 Hadoop 配置文件

　3）启动 hdfs

　4）停止 hdfs