hadoop伪分布模式,只有一个节点,通常用来做测试。

一、环境准备

  • Linux网络配置已完成,可参见CentOS7网络配置
  • yum源成功挂载,可参见CentOS7本地yum源挂载
  • Linux已安装OracleJDK1.8+,可参见OracleJDK1.8安装
  • zookeeper-3.4.6.tar.gz安装包,hadoop安装包下载
  • 二、创建Hadoop用户(以后有关集群的操作都只用此用户);

  • su 到root用户下,并创建用户;
  • 三、配置SSH互相(免密登录);

  • 生成SSH密钥对(公钥/私钥),在Hadoop用户下;
  • 进入ssh目录;
  • 测试ssh 主机名;
  • 四、解压Hadoop安装包;

  • 在Hadoop用户家目录下创建安装目录;
  • 解压Hadoop安装包(可用xshell等工具将安装包上传到Linux);
  • 五、修改配置文件;

    1. 修改hadoop-env.sh,配置jdk位置;
    2. 修改core-site.xml;
    3. <property>
      <name>fs.defaultFS</name>
      <value>hdfs://hadoop01:9000</value>
      <!—- hadoop01:主机名,9000:端口 -->
      </property> <property>
      <name>hadoop.tmp.dir</name>
      <value>/data/hadoop/tmp</value>
      </property>
    4. hdfs-site.xml配置;
    5. <property>
      <!-- 数据冗余一份 -->
      <name>dfs.replication</name>
      <value>1</value>
      </property>
    6. 配置Mapreduce调用方式;
    7. <property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
      </property>
    8. yarn有关的配置;
    9. <property>
      <name>yarn.resourcemanager.hostname</name>
      <value>hadoop01</value>
      <!—hadoop01:主机名 -->
      </property> <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value>
      </property>

    六、创建Hadoop数据目录(su到root用户下);

    1. su – root

    七、配置系统环境变量;

    1. 在root用户下修改环境变量,并使生效;

    八、格式化namenode节点(注意:只能格式化一次);

    1. 在hodoop用户下,格式化namenode(执行一次命令即可);

    九、启动集群;

    1. 使用hadoop用户启动集群;

    十、验证集群是否部署成功;

    1. 从Windows访问HDFS页面;
    2. 从Windows访问yarn页面;
    3. 能出来以上界面,表明伪分布模式部署成功;

    4. 停止集集群:

    Hadoop2.x伪分模式部署的更多相关文章

    1. Hadoop伪分布式模式部署

      Hadoop的安装有三种执行模式: 单机模式(Local (Standalone) Mode):Hadoop的默认模式,0配置.Hadoop执行在一个Java进程中.使用本地文件系统.不使用HDFS, ...

    2. 初学者值得拥有【Hadoop伪分布式模式安装部署】

      目录 1.了解单机模式与伪分布模式有何区别 2.安装好单机模式的Hadoop 3.修改Hadoop配置文件---五个核心配置文件 (1)hadoop-env.sh 1.到hadoop目录中 ​ 2.修 ...

    3. zookeeper集群&伪集群模式部署

      1.什么是单机部署 一台服务器上面部署一个单机版本的zookeeper服务,用于提供服务. 2.什么是集群部署? 集群部署就是多台服务器上面各部署单独的一个zookeeper服务,然后组建一个集群 3 ...

    4. 分布式集群HA模式部署

      一:HDFS系统架构 (一)利用secondary node备份实现数据可靠性 (二)问题:NameNode的可用性不高,当NameNode节点宕机,则服务终止 二:HA架构---提高NameNode ...

    5. 3-2 Hadoop集群伪分布模式配置部署

      Hadoop伪分布模式配置部署 一.实验介绍 1.1 实验内容 hadoop配置文件介绍及修改 hdfs格式化 启动hadoop进程,验证安装 1.2 实验知识点 hadoop核心配置文件 文件系统的 ...

    6. 一脸懵逼学习Hadoop分布式集群HA模式部署(七台机器跑集群)

      1)集群规划:主机名        IP      安装的软件                     运行的进程master    192.168.199.130   jdk.hadoop      ...

    7. spark 源码编译 standalone 模式部署

      本文介绍如何编译 spark 的源码,并且用 standalone 的方式在单机上部署 spark. 步骤如下: 1. 下载 spark 并且解压 本文选择 spark 的最新版本 2.2.0 (20 ...

    8. Spark运行模式与Standalone模式部署

      上节中简单的介绍了Spark的一些概念还有Spark生态圈的一些情况,这里主要是介绍Spark运行模式与Spark Standalone模式的部署: Spark运行模式 在Spark中存在着多种运行模 ...

    9. Hadoop伪分布模式配置部署

      .实验环境说明 注意:本实验需要按照上一节单机模式部署后继续进行操作 1. 环境登录 无需密码自动登录,系统用户名 shiyanlou,密码 shiyanlou 2. 环境介绍 本实验环境采用带桌面的 ...

    随机推荐

    1. IIS只允许某些IP访问

      1. 2. 3.访问时提示 4.设置允许访问的IP 5.指定的IP访问时没问题了,而其他的IP不允许访问

    2. 基于SSH协议clone GitHub远端仓库到本地-git

      经常逛 GitHub 的可能都知道,在 clone 远端仓库的时候,会有两个选项,如下图: 首先我们来说明一下两种方式的区别. 使用 HTTPS url 克隆对初学者来说会比较方便,复制HTTPS u ...

    3. 4.jQuery和DOM 对象之间的相互转换

      <!DOCTYPE html> <html> <head lang="en"> <meta charset="UTF-8&quo ...

    4. 通过文件路径读取CSV表格内的数据

      ReadDataFromCSV.h UCLASS() class MYPROJECT_API UReadDataFromCSV : public UBlueprintFunctionLibrary { ...

    5. Qt 学习之路 2(74):线程和 QObject

      Home / Qt 学习之路 2 / Qt 学习之路 2(74):线程和 QObject Qt 学习之路 2(74):线程和 QObject  豆子  2013年12月3日  Qt 学习之路 2  2 ...

    6. Servlet记录

      [Servlet]java语言编写动态资源的开发技术,普通的java类 [转发与重定向的区别] 转发在服务器端完成的:重定向是在客户端完成的 转发的速度快:重定向速度慢 转发的是同一次请求:重定向是两 ...

    7. 分布式中为什么要加入redis缓存的理解

      面我们介绍了mybatis自带的二级缓存,但是这个缓存是单服务器工作,无法实现分布式缓存.那么什么是分布式缓存呢?假设现在有两个服务器1和2,用户访问的时候访问了1服务器,查询后的缓存就会放在1服务器 ...

    8. java 开发原则(七个)

      转自 : https://blog.csdn.net/u011288271/article/details/52497602 对于Java看到过一个很有意思的说法:Java有六大心法,23种武功招式. ...

    9. 教你搭建SpringMVC框架( 附源码)

      一.项目目录结构 二.SpringMVC需要使用的jar包 commons-logging-1.2.jar junit-4.10.jar log4j-api-2.0.2.jar log4j-core- ...

    10. RPC 定义 和 原理

      一.RPC 1. RPC是什么 RPC(Remote Procedure Call Protocol)——远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议. ...