• 所有的内容都来源与 Hadoop 官方文档

一、Hadoop 伪分布式安装步骤

 1)JDK安装

  • 解压:tar -zxvf jdk-7u79-linux-x64.tar.gz -C ~/app
  • 添加到系统环境变量
  1. ~/.bash_profile
  2. export JAVA_HOME=/home/hadoop/app/jdk1.7.0_79
  3. export PATH=$TAVA_HOME/bin:$PATH
  • 环境变量生效:source ~/bash_profile
  • 验证Java是否配置成功:java -v

 2)ssh安装

二、HDFS伪分布式环境搭建

 1)下载并解压hadoop

  • 下载:cdh网站下载
  • 解压:tar -zxvf hadoop-2.6.0-cdh5.7.0.tar.gz -C ~/app

 2)修改 Hadoop 配置文件

  • 在 hadoop_home/etc/hadoop 目录下修改
  • 配置 hadoop-env.sh 文件

  1. 配置:export JAVA_HOME=/home/hadoop/app/jdk1.7.0_79
  • 配置 cor-site.xml 及 hdfs-site.xml 文件

  • cor-site.xml 中,默认的数据存放在临时文件夹,需要添加新的属性(hadoop.tmp.dir),可以指定存放的文件夹(如存放在文件夹 /home/hadoop/app 中),防止数据在每次重启系统时被删除;
  • 配置 slaves 文件:用于添加素有 DataNode 的名字;

 3)启动 hdfs

  • 格式化文件系统(在客户端操作,且仅第一次执行即可,不要重复执行):hdfs namenode -format,或者 hadoop namenode -format
  • 启动 hdfs:(sbin 目录下)sbin/start-dfs.sh
  • 验证是否启动成功:
  1. 3 个进程,如果缺少,说明缺少的部分配置不成功;(可通过日志输出查看进程的启动过程)
  • 浏览器访问方式:http://localhost:50070

 4)停止 hdfs

  • (在 sbin 目录下)sbin/stop-dfs.sh

三、HDFS 的shell 操作

  • hdfs dfs + commands 或者 hadoop fs + commands

  • 用法与 Linux 命令相同

  • 例:

  1. hadoop fs -put hello.txt:将文件 hello.txt 从本地传到 HDFS 上;
  2. hadoop fs -get hello.txt:从 HDFS 上获取文件 hello.txt 到本地;
  3. hadoop fs -text /hello.txt:查看文件 hello.txt 的内容;
  4. hadoop fs -mkdir /test:在 HDFS 上创建一个目录 test;
  5. hadoop fs -mkdir -p /test/a/b:在 HDFS 上创建递归文件夹;
  6. hadoop fs -rm /hello.txt:删除一个文件;(-rm 不能删除文件夹,只能删除文件)
  7. hadoop fs -rm -R /test:删除文件夹 test 及其下所有递归文件;
  8. hadoop fs -ls -R:查看递归文件夹;

大数据:Hadoop(JDK安装、HDFS伪分布式环境搭建、HDFS 的shell操作)的更多相关文章

  1. HDFS 伪分布式环境搭建

    HDFS 伪分布式环境搭建 作者:Grey 原文地址: 博客园:HDFS 伪分布式环境搭建 CSDN:HDFS 伪分布式环境搭建 相关软件版本 Hadoop 2.6.5 CentOS 7 Oracle ...

  2. HDFS伪分布式环境搭建

    (一).HDFS shell操作 以上已经介绍了如何搭建伪分布式的Hadoop,既然环境已经搭建起来了,那要怎么去操作呢?这就是本节将要介绍的内容: HDFS自带有一些shell命令,通过这些命令我们 ...

  3. 大数据hadoop入门学习之集群环境搭建集合

    目录: 1.基本工作准备 1.虚拟机准备 2.java 虚拟机-jdk环境配置 3.ssh无密码登录 2.hadoop的安装与配置 3.hbase安装与配置(集成安装zookeeper) 4.zook ...

  4. Hadoop学习笔记1:伪分布式环境搭建

    在搭建Hadoop环境之前,请先阅读如下博文,把搭建Hadoop环境之前的准备工作做好,博文如下: 1.CentOS 6.7下安装JDK , 地址: http://blog.csdn.net/yule ...

  5. Hadoop 2.7 伪分布式环境搭建

    1.安装环境 ①.一台Linux CentOS6.7 系统 hostname                ipaddress              subnet mask             ...

  6. 【Hadoop】伪分布式环境搭建、验证

    Hadoop伪分布式环境搭建: 自动部署脚本: #!/bin/bash set -eux export APP_PATH=/opt/applications export APP_NAME=Ares ...

  7. CentOS7下Hadoop伪分布式环境搭建

    CentOS7下Hadoop伪分布式环境搭建 前期准备 1.配置hostname(可选,了解) 在CentOS中,有三种定义的主机名:静态的(static),瞬态的(transient),和灵活的(p ...

  8. 【Hadoop离线基础总结】CDH版本Hadoop 伪分布式环境搭建

    CDH版本Hadoop 伪分布式环境搭建 服务规划 步骤 第一步:上传压缩包并解压 cd /export/softwares/ tar -zxvf hadoop-2.6.0-cdh5.14.0.tar ...

  9. Hadoop2.5.0伪分布式环境搭建

    本章主要介绍下在Linux系统下的Hadoop2.5.0伪分布式环境搭建步骤.首先要搭建Hadoop伪分布式环境,需要完成一些前置依赖工作,包括创建用户.安装JDK.关闭防火墙等. 一.创建hadoo ...

随机推荐

  1. ES6新增的数组方法

    ES6新增:(IE9级以上支持) 1.forEach():遍历数组,无返回值,不改变原数组. 2.map():遍历数组,返回一个新数组,不改变原数组. 3.filter():过滤掉数组中不满足条件的值 ...

  2. 洛谷 P5057 [CQOI2006]简单题 题解

    P5057 [CQOI2006]简单题 题目描述 有一个 n 个元素的数组,每个元素初始均为 0.有 m 条指令,要么让其中一段连续序列数字反转--0 变 1,1 变 0(操作 1),要么询问某个元素 ...

  3. 基于 SpringBoot2.0+优雅整合 SpringBoot+Mybatis

    SpringBoot 整合 Mybatis 有两种常用的方式,一种就是我们常见的 xml 的方式 ,还有一种是全注解的方式.我觉得这两者没有谁比谁好,在 SQL 语句不太长的情况下,我觉得全注解的方式 ...

  4. MySQL 执行插入报错 - Incorrect string value: '\xE4\xB8\xAD\xE6\x96\x87' for column 'name' at row 1

    报错的原因就是在执行插入时对Name这个字段被赋予了错误的字符串值:’\xE4\xB8\xAD\xE6\x96\x87’ 实际上就函数里面的变量接收到的值编码格式跟它定义的不一致.  使用navica ...

  5. Golang(四)正则表达式使用

    0. 前言 最近用到了 regexp 包,下面整理下正则表达式相关用法 参考 基础知识 - Golang 中的正则表达式 和 Golang regexp包中的函数和方法 做了汇总 1. 正则表达式 1 ...

  6. CentOS安装Hadoop

    Hadoop的核心由3个部分组成: HDFS: Hadoop Distributed File System,分布式文件系统,hdfs还可以再细分为NameNode.SecondaryNameNode ...

  7. .net core 在 View 中使用 Jquery 无效问题

    问题描述: 在 View 视图中使用模板 _Layout.cshtml,其中模板已经调用了 Jquery.js ,但是在 View 视图下写 js 无效.后来通过浏览器查看自己写的 js 压根没加载出 ...

  8. javascript的立即执行函数

    在javascript中有引入立即执行函数的概念,那么什么是立即执行函数呢?立即执行函数又是怎么写的呢?立即执行函数与普通函数有什么区别呢? 先来看看一般的函数: function a(){ var ...

  9. Python3+PyCryptodome实现各种加密算法教程

    一.说明 PyCryptodome是python一个强大的加密算法库,可以实现常见的单向加密.对称加密.非对称加密和流加密算法.直接pip安装即可: pip install pycryptodome ...

  10. Remote Desktop突然不能用了 “This could be due to CredSSP encryption oracle remediation”

    一段时间没有用RDP去连远程的Windows主机,某一天突然发现用不了了. 错误信息如下: An authentication error has occurred. The function req ...