HamaWhite(QQ:530422429)原创作品,转载请注明出处:http://write.blog.csdn.net/postedit/40556267

本文是依据Hadoop官网安装教程写的Hadoop YARN在单机伪分布式环境下的安装报告。仅供參考。

1. 安装环境例如以下:

    系统:Ubuntu14.04

    Hadoop版本号:hadoop-2.5.0

   Java版本号:openjdk-1.7.0_55 

2. 下载Hadoop-2.5.0,http://mirrors.cnnic.cn/apache/hadoop/common/hadoop-2.5.0/hadoop-2.5.0.tar.gz  

    本文的$HADOOP_HOME为:/home/baisong/hadoop-2.5.0(username为baisong)。

    在 ~/.bashrc文件里加入环境变量,例如以下:

    export HADOOP_HOME=/home/baisong/hadoop-2.5.0

    然后编译,命令例如以下:

    $ source ~/.bashrc

3. 安装JDK,并设置JAVA_HOME环境变量。在/etc/profile文件最后加入例如以下内容

    export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-i386   //依据自己Java安装文件夹而定

    export PATH=$JAVA_HOME/bin:$PATH

    输入下面命令使配置生效

    $ source /etc/profile

4. 配置SSH。

首先生成秘钥,命令例如以下。然后一路回车确认,不须要不论什么输入。

$ ssh-keygen -t rsa    然后把公钥写入authorized_keys文件里。命令例如以下:

    $ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

    最后。输入下述命令。按提示输入 yes 就可以。

$ ssh localhost  

5. 改动Hadoop配置文件,进入${HADOOP_HOME}/etc/hadoop/文件夹。

    1)环境变量设置,hadoop-env.sh中加入Java安装文件夹,例如以下:

           export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-i386

    2)改动core-site.xml,加入例如以下内容。

<property>

             <name>fs.defaultFS</name>

             <value>hdfs://localhost:9000</value>

         </property>

         <property>

           <name>hadoop.tmp.dir</name>

           <value>/home/baisong/hadooptmp</value> 

        </property>

        注:hadoop.tmp.dir项可选(上述设置需手动创建hadooptmp目录)。

    3)改动hdfs-site.xml,加入下面内容“。

<property>

             <name>dfs.repliacation</name>

             <value>1</value>

         </property>

     4)将mapred-site.xml.template重命名为mapred-site.xml,并加入例如以下内容。

$ mv mapred-site.xml.template mapred-site.xml    //重命名

          <property>

            <name>mapreduce.framework.name</name>

            <value>yarn</value>

         </property>

    5)改动yarn-site.xml,加入下面内容。

<property>

            <name>yarn.nodemanager.aux-services</name>

            <value>mapreduce_shuffle</value>

         </property>

6. 格式化HDFS,命令例如以下:

    bin/hdfs namenode -format    凝视:bin/hadoop namenode -format命令已过时

    格式化成功会在/home/baisong/hadooptmp创建dfs目录。

7.启动HDFS,命令例如以下:

   $ sbin/start-dfs.sh 

   遇到例如以下错误:

14/10/29 16:49:01 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Starting namenodes on [OpenJDK Server VM warning: You have loaded library /home/baisong/hadoop-2.5.0/lib/native/libhadoop.so.1.0.0
which might have disabled stack guard. The VM will try to fix the stack guard now.
It's highly recommended that you fix the library with 'execstack -c <libfile>', or link it with '-z noexecstack'.
localhost]
sed: -e expression #1, char 6: unknown option to `s'
VM: ssh: Could not resolve hostname vm: Name or service not known
library: ssh: Could not resolve hostname library: Name or service not known
have: ssh: Could not resolve hostname have: Name or service not known
which: ssh: Could not resolve hostname which: Name or service not known
might: ssh: Could not resolve hostname might: Name or service not known
warning:: ssh: Could not resolve hostname warning:: Name or service not known
loaded: ssh: Could not resolve hostname loaded: Name or service not known
have: ssh: Could not resolve hostname have: Name or service not known
Server: ssh: Could not resolve hostname server: Name or service not known

分析原因知。没有设置 HADOOP_COMMON_LIB_NATIVE_DIR和HADOOP_OPTS环境变量。在 ~/.bashrc文件里加入例如以下内容并编译。    

    export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

    export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"   

    $ source ~/.bashrc

    又一次启动HDFS,输出例如以下。表示启动成功。   

    

    能够用过Web界面来查看NameNode执行状况。URL为 http://localhost:50070

    停止HDFS的命令为:

    $ sbin/stop-dfs.sh

8. 启动YARN,命令例如以下:

   $ sbin/start-yarn.sh

   能够用过Web界面来查看NameNode执行状况,URL为 http://localhost:8088

   停止HDFS的命令为:

 
 $ sbin/stop-yarn.sh

   上述HDFS和YARN启动完毕后,可通过jps命令查看是否启动成功。

  

9. 执行測试程序。

1)測试计算PI,命令例如以下:

       $ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar
pi 20 10

   2)測试 grep,首先须要上传输入文件到HDFS上。命令例如以下:

      $
bin/hdfs dfs -put etc/hadoop input

       执行grep程序,命令例如以下:

       $ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar grep input output 'dfs[a-z.]+'

       执行结果输出例如以下:      

10. 加入环境变量,方便使用start-dfs.sh、start-yarn.sh等命令(可选)。

在 ~/.bashrc文件里加入环境变量,例如以下:

     export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

     然后编译,命令例如以下:

     $ source ~/.bashrc

     下图是 ~/.bashrc文件里加入的变量,以便參考。 

   

Hadoop Yarn(一)—— 单机伪分布式环境安装的更多相关文章

  1. Hadoop 3.1.3伪分布式环境安装Hive 3.1.2的异常总结

    背景:hadoop版本为3.1.3, 且以伪分布式形式安装,hive版本为3.1.2,hive为hadoop的一个客户端. 1. 安装简要步骤 (1) 官网下载apache-hive-3.1.2-bi ...

  2. Hadoop:Hadoop单机伪分布式的安装和配置

    http://blog.csdn.net/pipisorry/article/details/51623195 因为lz的linux系统已经安装好了很多开发环境,可能下面的步骤有遗漏. 之前是在doc ...

  3. Hadoop 在windows 上伪分布式的安装过程

    第一部分:Hadoop 在windows 上伪分布式的安装过程 安装JDK 1.下载JDK        http://www.oracle.com/technetwork/java/javaee/d ...

  4. Ubuntu15.10下Hadoop2.6.0伪分布式环境安装配置及Hadoop Streaming的体验

    Ubuntu用的是Ubuntu15.10Beta2版本,正式的版本好像要到这个月的22号才发布.参考的资料主要是http://www.powerxing.com/install-hadoop-clus ...

  5. hadoop 2.7.3伪分布式环境运行官方wordcount

    hadoop 2.7.3伪分布式模式运行wordcount 基本环境: 系统:win7 虚机环境:virtualBox 虚机:centos 7 hadoop版本:2.7.3 本次以伪分布式模式来运行w ...

  6. Hadoop Single Node Setup(hadoop本地模式和伪分布式模式安装-官方文档翻译 2.7.3)

    Purpose(目标) This document describes how to set up and configure a single-node Hadoop installation so ...

  7. Hadoop伪分布式环境安装

    一.环境准备 阿里云ECS(Centos7).已预装JDK8 Hadoop安装包 hadoop-2.7.7.tar.gz 二. 安装步骤 1.确认JDK环境的安装位置 命令 echo $JAVA_HO ...

  8. hadoop 2.6.0 伪分布式部署安装遇到的问题

    之前读到了一篇关于配置安装hadoop的博文(地址:http://www.powerxing.com/install-hadoop/)能正确安装和运行,但是在网页进行Jobtracker监控时,输入l ...

  9. 转载:Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04

    原文 http://www.powerxing.com/install-hadoop/ 当开始着手实践 Hadoop 时,安装 Hadoop 往往会成为新手的一道门槛.尽管安装其实很简单,书上有写到, ...

随机推荐

  1. JS实现LOGO像雪花一样落下特效

    <HTML><HEAD><TITLE>LOGO从上落下</TITLE> <SCRIPT language=JavaScript> //窗口改 ...

  2. 语义分割:使用关系图辅助图像分割-Capsule Network、IceNet

    文章:欲取代CNN的Capsule Network究竟是什么来头?它能为AI界带来革命性转折么? 文章:用于分类.检测和分割的移动网络 MobileNetV2 网络 文章:后RCNN时代的物体检测及分 ...

  3. Objective-C中copy 、retain以及ARC中新加入的strong、weak关键字的含义

    copy: 创建一个引用计数为1的对象,然后释放旧的对象 retain:释放旧的对象,将旧对象的值赋予输入对象,再提高输入对象的引用计数为 1 Copy其实是建立了一个相同的对象,而retain不是: ...

  4. MFC_2.7 树控件的基本使用

    树控件的基本使用 1.添加控件设置变量绑定 2.添加数据 HTREEITEM RootNode1 = m_TreeCtrl.InsertItem(L"北京"); HTREEITEM ...

  5. Deployd的使用

    deployd一个生成后台数据的软件,可以创建json格式的数据,也可以对数据进行增删改查等操作,甚至可以验证登录,简直就是自学好帮手呀,不用后台搞定后台,就用deployd 下载:链接: https ...

  6. Mybatis学习总结一

    一.Mybatis架构  JAR包下载地址 1.  mybatis配置 SqlMapConfig.xml,此文件作为mybatis的全局配置文件,配置了mybatis的运行环境等信息. mapper. ...

  7. 09Microsoft SQL Server 表数据插入,更新,删除

    Microsoft SQL Server 表数据插入,更新,删除 向表中插入数据 INSERT INTO insert into tb1 values(0004,'张凤凤') insert into ...

  8. JavaScript day1(注释)

    JavaScript中的注释方式有两种: 单行注释,使用 //. // This is an in-line comment. 多行注释,以/*开始,用*/来结束. /* This is a mult ...

  9. css3文字渐变无效果的解决方案

    现在css3越来月流行了,为了实现一些高大上的效果,我们会用一些渐变的特效,请看文字渐变的特效代码: .title { font-size: 60px; line-height: 80px; text ...

  10. Luogu P1311 选择客栈

    暴力 我一开始做这道题先想到的就是暴力... 所以先说一下暴力的做法.首先在输入的时候讲花费小于P的位置标记下来,然后用两层循环枚举所有的两个客栈的组合方案.再用一层循环将两个客栈之间的位置扫一遍,如 ...