伪分布式模式等同于完全分布式,只是她只有一个节点。

一) HDFS上运行MapReduce 程序

(1)配置集群

  (a)配置:hadoop-env.sh

    Linux系统中获取jdk的安装路径:

    修改JAVA_HOME 路径:

  (b)配置:core-site.xml

    原始该文件内容

    配置后该文件内容

  (c)配置:hdfs-site.xml

    该文件原始内容

    配置后该文件内容

(2)启动集群

  (a)格式化namenode(第一次启动时格式化,以后就不要总格式化)

  (b)启动namenode

  (c)启动datanode

(3)查看集群

  (a)查看是否启动成功

  (b)查看产生的log日志

  (c)web端查看HDFS文件系统

    在浏览器中输入 http://192.168.47.101:50070/

    至此一个Hadoop的伪分布模式即搭建完成

(4)操作集群

  (a)在hdfs文件系统上创建一个input文件夹

    进入Web查看是否创建成功

  (b)将测试文件内容上传到文件系统上

  (c)查看上传的文件是否正确

  (d)在Hdfs上运行mapreduce程序

  (e)查看输出结果

    命令行查看:

    浏览器查看

  (f)将测试文件内容下载到本地

    点击上一步浏览器查看中的part-r-00000

    将 part-r-00000文件下载后查看

  (g)删除输出结果

二) YARN上运行MapReduce 程序

(1)配置集群

  (a)配置yarn-env.sh

    配置JAVA_HOME

  (b)配置yarn-site.xml

    增加两个属性节点

  (c)配置:mapred-env.sh

配置JAVA_HOME

  (d)配置: (对mapred-site.xml.template重新命名为) mapred-site.xml

并配置相应节点

(2)启动集群

启动集群之前先要保证namenode和datanode正常启动

  (a)启动resourcemanager

  (b)启动nodemanager

(3)集群操作

  (a)yarn的浏览器页面查看

启动成功后在浏览器中输入对应地址可查看

  (b)执行mapreduce程序

  (c)查看运行结果

  (d)删除文件系统上的output文件

三) 修改本地临时文件存储目录

1)停止进程

按照resourcemanager/nodemanager->datanode/namenode的先后顺停止进程

2)修改hadoop.tmp.dir

hadoop默认生成的dfs等文件放在 /tmp/hadoop-{hostname} 下的当重启后 系统临时文件夹中内容被清除,因此需要重新配置临时文件夹

在hadoop-2.7.2中新建 data/tmp 文件夹

后修改 core-site.xml,增加属性节点

3)格式化NameNode

4)启动所有进程

按照 namenode/datanode->resourcemanager/nodemanager顺序启动

5)查看/opt/module/hadoop-2.7.2/data/tmp这个目录下的内容

啃掉Hadoop系列笔记(04)-Hadoop运行模式之伪分布式模式的更多相关文章

  1. 啃掉Hadoop系列笔记(03)-Hadoop运行模式之本地模式

    Hadoop的本地模式为Hadoop的默认模式,不需要启用单独进程,直接可以运行,测试和开发时使用. 在<啃掉Hadoop系列笔记(02)-Hadoop运行环境搭建>中若环境搭建成功,则直 ...

  2. Hadoop Single Node Setup(hadoop本地模式和伪分布式模式安装-官方文档翻译 2.7.3)

    Purpose(目标) This document describes how to set up and configure a single-node Hadoop installation so ...

  3. 啃掉Hadoop系列笔记(01)-Hadoop框架的大数据生态

    一.Hadoop是什么 1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构 2)主要解决,海量数据的存储和海量数据的分析计算问题. 3)广义上来说,HADOOP通常是指一个更广泛的概 ...

  4. 3 hadoop安装Standalone模式和伪分布式模式

    1 Standalone模式默认模式,即默认配置即是standalone模式装好hadoop-client,会将依赖的包安装好yum install hadoop-client配置文件各个配置文件在/ ...

  5. Hadoop的单机模式、伪分布式模式和完全分布式模式

    1.单机(非分布式)模式 这种模式在一台单机上运行,没有分布式文件系统,而是直接读写本地操作系统的文件系统. 2.伪分布式运行模式 这种模式也是在一台单机上运行,但用不同的Java进程模仿分布式运行中 ...

  6. 啃掉Hadoop系列笔记(02)-Hadoop运行环境搭建

    一.新增一个普通用户bigdata

  7. 网站用户行为分析——Hadoop的安装与配置(单机和伪分布式)

    Hadoop安装方式 Hadoop的安装方式有三种,分别是单机模式,伪分布式模式,伪分布式模式,分布式模式. 单机模式:Hadoop默认模式为非分布式模式(本地模式),无需进行其他配置即可运行.非分布 ...

  8. 云计算课程实验之安装Hadoop及配置伪分布式模式的Hadoop

    一.实验目的 1. 掌握Linux虚拟机的安装方法. 2. 掌握Hadoop的伪分布式安装方法. 二.实验内容 (一)Linux基本操作命令 Linux常用基本命令包括: ls,cd,mkdir,rm ...

  9. [Hadoop] Hadoop学习笔记之Hadoop基础

    1 Hadoop是什么? Google公司发表了两篇论文:一篇论文是“The Google File System”,介绍如何实现分布式地存储海量数据:另一篇论文是“Mapreduce:Simplif ...

随机推荐

  1. Codevs 1404 字符串匹配(Kmp)

    1404 字符串匹配 时间限制: 1 s 空间限制: 128000 KB 题目等级 : 大师 Master 题目描述 Description 给你两个串A,B,可以得到从A的任意位开始的子串和B匹配的 ...

  2. HDU 1024 Max Sum Plus Plus ——(M段区间的最大和)

    感觉有点奇怪的是这题明明是n^2的复杂度,n=1e6竟然能过= =.应该是数据水了. dp[i][j]表示前j个数,分成i段,且最后一段的最后一个为a[j]的答案.那么转移式是:dp[i][j] = ...

  3. 图论——Floyd算法拓展及其动规本质

    一.Floyd算法本质 首先,关于Floyd算法: Floyd-Warshall算法是一种在具有正或负边缘权重(但没有负周期)的加权图中找到最短路径的算法.算法的单个执行将找到所有顶点对之间的最短路径 ...

  4. CSS3-弹性盒布局(Flex Box)

    弹性盒布局(Flex Box) 一.概念 弹性盒子是 CSS3 的一种新的布局模式. CSS3 弹性盒( Flexible Box 或 flexbox),是一种当页面需要适应不同的屏幕大小以及设备类型 ...

  5. JAVA之自动内存管理机制

    一.内存分配 1.JVM体系结构 2.运行时数据区域 3.内存分配二.内存回收 1.垃圾收集算法 2.垃圾收集器三.相关参考一.内存分配JVM体系结构 在了解自动内存管理的内存分配之前,我们先看下JV ...

  6. 实例分析jdom和dom4j的使用和区别 (转)

    实例分析jdom和dom4j的使用和区别   对于xml的解析和生成,我们在实际应用中用的比较多的是JDOM和DOM4J,下面通过例子来分析两者的区别(在这里我就不详细讲解怎么具体解析xml,如果对于 ...

  7. logserver 日志服务项目发布

    logserver是使用logback.light-4j.commons-exec等构建的简单日志服务,参考项目logbackserver和light4j,支持跟踪日志.分页查看.搜索定位.下载文件等 ...

  8. php屏蔽电话号码中间四位

    php屏蔽电话号码中间四位 一.总结 一句话总结: 直接就是substr_replace函数:$str = substr_replace("13966778888",'****', ...

  9. [java]取当前平台默认字符集,取字符串长度

    public class TimestampLength { public static void main(String[] args) { System.out.println(java.nio. ...

  10. Android : 供应商原生开发套件 (VNDK)

    一.VNDK概述 VNDK(Vendor Native Development Kit)是一组专门用于vendor实现其HAL的lib库,因为自Android 8.0以来,Google引入了Trebl ...