以前都是玩 java,没搞过 hadoop,所以以此系列文章来记录下学习过程

  安装的文件版本、操作系统说明

centos-6.5-x86_64
[bamboo@hadoop-senior opt]$ uname -a
Linux hadoop-senior.bamboo.com 2.6.32-696.16.1.el6.x86_64  

  jdk、hadoop

[bamboo@hadoop-senior softwares]$ ll
total 443172
-rw-r--r--. 1 bamboo bamboo 311430119 Dec 29 23:52 hadoop-2.5.0.tar.gz
-rw-r--r--. 1 bamboo bamboo 142376665 Dec 30 02:17 jdk-7u67-linux-x64.tar.gz
  • 1. 在 opt 目录下创建 4 个目录:
[bamboo@hadoop-senior opt]$ ll
total 20
drwxr-xr-x. 2 bamboo bamboo 4096 Dec 30 18:05 datas
drwxr-xr-x. 4 bamboo bamboo 4096 Dec 30 18:32 modules
drwxr-xr-x. 2 root root 4096 Oct 3 22:14 rh
drwxr-xr-x. 2 bamboo bamboo 4096 Dec 30 18:16 softwares
drwxr-xr-x. 2 bamboo bamboo 4096 Dec 30 18:05 tools

  

  •  2.安装前先检查下 java

  

rpm -qa | grep java
如果有的话,会返回一系列的内容,
[bamboo@hadoop-senior opt]$ rpm -qa | grep java
[bamboo@hadoop-senior opt]$ 可以看到我的机器是是没有的,如果返回有记录的话,则执行如下的命令 rpm -e --nodeps 1 2 3(1 2 3 是执行命令返回的结果集)
 
 
  •   3.安装 java
  

    3.1 解压 jdk
  tar -zxvf jdk*.tar.gz -C /opt/modules   3.2 配置环境变量
  vim /etc/profile   在最后添加如下的配置
  export JAVA_HOME=/opt/modules/jdk1.7.0_67
  export PATH=$PATH:$JAVA_HOME/bin   保存退出   3.3 生效配置
  source /etc/profile
  这样即可生效   3.4 验证 java 是否安装成功
  [bamboo@localhost jdk1.7.0_67]$ java -version
  java version "1.7.0_67"
  Java(TM) SE Runtime Environment (build 1.7.0_67-b01)
  Java HotSpot(TM) 64-Bit Server VM (build 24.65-b04, mixed mode)   可以看到已经生效
 
  • 4.安装 hadoop
  

4.1 解压 hadoop
tar -zxvf hadoop-2.5.0.tar.gz -C /opt/modules/ 4.2 配置 hadoop-env.sh 环境变量
/opt/modules/hadoop-2.5.0/etc/hadoop/hadoop-env.sh
vim hadoop-env.sh
配置 jdk 路径
export JAVA_HOME=/opt/modules/jdk1.7.0_67 4.3 启动 hadoop (有 3 种启动方式) 4.3.1 切换到安装根目录,然后创建 input 目录
[bamboo@localhost hadoop-2.5.0]$ pwd
/opt/modules/hadoop-2.5.0
[bamboo@localhost hadoop-2.5.0]$ mkdir input
[bamboo@localhost hadoop-2.5.0]$ ls
bin etc include input lib libexec sbin share 4.3.2 把 etc/hadoop 下的 xml 文件 cp 到 input 目录下
[bamboo@localhost hadoop-2.5.0]$ cp etc/hadoop/*.xml input/
[bamboo@localhost hadoop-2.5.0]$ cd input/
[bamboo@localhost input]$ ls
capacity-scheduler.xml core-site.xml hadoop-policy.xml hdfs-site.xml httpfs-site.xml yarn-site.xml 4.3.3 启动 hadoop
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar grep input output 'dfs[a-z.]+' 执行成功,并没有报错 执行 ls,可以看到多了 output目录:
[bamboo@localhost hadoop-2.5.0]$ ls
bin etc include input lib libexec output sbin share
[bamboo@localhost hadoop-2.5.0]$ cat output/*
1 dfsadmin 测试一个统计字符的
mkdir wcinput
vim wcinput
hadoop yarn
hadoop mapreduce
hadoop hdfs
yarn nodemanager
hadoop resourcemanager 然后启动 hadoop:
[bamboo@localhost hadoop-2.5.0]$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar wordcount wcinput wcoutput [bamboo@localhost hadoop-2.5.0]$ cat wcoutput/*
hadoop 4
hdfs 1
mapreduce 1
nodemanager 1
resourcemanager 1
yarn 2
[bamboo@localhost hadoop-2.5.0]$ cat wcinput/
cat: wcinput/: Is a directory
[bamboo@localhost hadoop-2.5.0]$ cat wcinput/*
hadoop yarn
hadoop mapreduce
hadoop hdfs
yarn nodemanager
hadoop resourcemanager
 
这个模式是 hadoop 的 Standalone Operation 启动模式.下一篇继续 Pseudo-Distributed Mode.
 
当然也可以参考官网的 getstart 文档,链接如下:

Hadoop 系列文章(一) Hadoop 的安装,以及 Standalone Operation 的启动模式测试的更多相关文章

  1. Hadoop 系列文章(二) Hadoop配置部署启动HDFS及本地模式运行MapReduce

    接着上一篇文章,继续我们 hadoop 的入门案例. 1. 修改 core-site.xml 文件 [bamboo@hadoop-senior hadoop-2.5.0]$ vim etc/hadoo ...

  2. 啃掉Hadoop系列笔记(03)-Hadoop运行模式之本地模式

    Hadoop的本地模式为Hadoop的默认模式,不需要启用单独进程,直接可以运行,测试和开发时使用. 在<啃掉Hadoop系列笔记(02)-Hadoop运行环境搭建>中若环境搭建成功,则直 ...

  3. hadoop系列一:hadoop集群安装

     转载请在页首明显处注明作者与出处 http://www.cnblogs.com/zhuxiaojie/p/6384393.html 一:说明 此为大数据系列的一些博文,有空的话会陆续更新,包含大数据 ...

  4. 啃掉Hadoop系列笔记(01)-Hadoop框架的大数据生态

    一.Hadoop是什么 1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构 2)主要解决,海量数据的存储和海量数据的分析计算问题. 3)广义上来说,HADOOP通常是指一个更广泛的概 ...

  5. Redis 学习笔记系列文章之 Redis 的安装与配置 (一)

    1. 介绍 Redis is an open source (BSD licensed), in-memory data structure store, used as database, cach ...

  6. 安装Hadoop系列 — eclipse plugin插件编译安装配置

    [一].环境参数 eclipse-java-kepler-SR2-linux-gtk-x86_64.tar.gz //现在改为eclipse-jee-kepler-SR2-linux-gtk-x86_ ...

  7. Hadoop 系列文章(三) 配置部署启动YARN及在YARN上运行MapReduce程序

    这篇文章里我们将用配置 YARN,在 YARN 上运行 MapReduce. 1.修改 yarn-env.sh 环境变量里的 JAVA_HOME 路径 [bamboo@hadoop-senior ha ...

  8. Hadoop系列教程<一>---Hadoop是什么呢?

    Hadoop适合应用于大数据存储和大数据分析的应用,适合于服务器几千台到几万台的集群运行,支持PB级的存储容量.Hadoop典型应用有:搜索.日志处理.推荐系统.数据分析.视频图像分析.数据保存等.但 ...

  9. 啃掉Hadoop系列笔记(04)-Hadoop运行模式之伪分布式模式

    伪分布式模式等同于完全分布式,只是她只有一个节点. 一) HDFS上运行MapReduce 程序 (1)配置集群 (a)配置:hadoop-env.sh Linux系统中获取jdk的安装路径:

随机推荐

  1. maven的单元测试中没有

    原因:BaseTest没有找到单元测试造成的 增加一个空的单元测试 @Testpublic void testNothing(){} 异常现象:在maven项目执行mvn install 或mvn t ...

  2. SQLite在Android程序中的使用方法,SQLite的增删查改方法

    Sqlite: 1.一款用来实现本地数据存储的轻量级数据管理工具,是众多用来实现数据库管理的工具之一. 2.Android已经将SQLite的代码功能吸收在它的系统中,我们可以直接在Android程序 ...

  3. php状态设计模式

    状态设计模式的关键就是,环境中拥有所需的全部状态对象,每个状态对象又引用了环境对象:环境对象通过维护一个当前状态属性(用于存放状态对象)从而对所需的全部状态对象产生影响. 下面演示了一个简单的状态设计 ...

  4. openvas安装和基本使用

    OpenVAS是开放式漏洞评估系统,也可以说它是一个包含着相关工具的网络扫描器. OpenVAS是开放式漏洞评估系统,也可以说它是一个包含着相关工具的网络扫描器.其核心部件是一个服务器,包括一套网络漏 ...

  5. vsCode关闭代码检查工具

    在script标签里,第一行输入下面的内容即可:

  6. spring @transactional 注解事务

    1.在spring配置文件中引入<tx:>命名空间 <beans xmlns="http://www.springframework.org/schema/beans&qu ...

  7. SVN中英文菜单对照

    TortoiseSVN英文版菜单中文翻译01.SVN Checkout(SVN取出) 点击SVN Checkout,弹出检出提示框,在URL of repository输入框中输入服务器仓库地址,在C ...

  8. 深度学习项目——基于卷积神经网络(CNN)的人脸在线识别系统

    基于卷积神经网络(CNN)的人脸在线识别系统 本设计研究人脸识别技术,基于卷积神经网络构建了一套人脸在线检测识别系统,系统将由以下几个部分构成: 制作人脸数据集.CNN神经网络模型训练.人脸检测.人脸 ...

  9. POJ-1797.HeavyTransportation(最长路中的最小权值)

    本题思路:最短路变形,改变松弛方式即可,dist存的是源结点到当前结点的最长路的最小权值. 参考代码: #include <cstdio> #include <cstring> ...

  10. thinkphp 视图(三)系统变量——原生标签

    查看系统变量 dump($_SERVER); 在view中获取服务器变量 <p>{$Think.server.HTTP_HOST}</p> 获取env变量 status=dev ...