Hadoop 系列文章(一) Hadoop 的安装,以及 Standalone Operation 的启动模式测试

　　以前都是玩 java,没搞过 hadoop,所以以此系列文章来记录下学习过程

　　安装的文件版本、操作系统说明

centos-6.5-x86_64

[bamboo@hadoop-senior opt]$ uname -a

Linux hadoop-senior.bamboo.com 2.6.32-696.16.1.el6.x86_64

　　jdk、hadoop

[bamboo@hadoop-senior softwares]$ ll

total 443172

-rw-r--r--. 1 bamboo bamboo 311430119 Dec 29 23:52 hadoop-2.5.0.tar.gz

-rw-r--r--. 1 bamboo bamboo 142376665 Dec 30 02:17 jdk-7u67-linux-x64.tar.gz

1. 在 opt 目录下创建 4 个目录:

[bamboo@hadoop-senior opt]$ ll

total 20

drwxr-xr-x. 2 bamboo bamboo 4096 Dec 30 18:05 datas

drwxr-xr-x. 4 bamboo bamboo 4096 Dec 30 18:32 modules

drwxr-xr-x. 2 root root 4096 Oct 3 22:14 rh

drwxr-xr-x. 2 bamboo bamboo 4096 Dec 30 18:16 softwares

drwxr-xr-x. 2 bamboo bamboo 4096 Dec 30 18:05 tools

　2.安装前先检查下 java

rpm -qa | grep java

如果有的话，会返回一系列的内容，

[bamboo@hadoop-senior opt]$ rpm -qa | grep java

[bamboo@hadoop-senior opt]$

可以看到我的机器是是没有的，如果返回有记录的话，则执行如下的命令

rpm -e --nodeps 1 2 3(1 2 3 是执行命令返回的结果集)

　　3.安装 java

    3.1 解压 jdk

　　tar -zxvf jdk*.tar.gz -C /opt/modules

　　3.2 配置环境变量

　　vim /etc/profile

　　在最后添加如下的配置

　　export JAVA_HOME=/opt/modules/jdk1.7.0_67

　　export PATH=$PATH:$JAVA_HOME/bin

　　保存退出

　　3.3 生效配置

　　source /etc/profile

　　这样即可生效

　　3.4 验证 java 是否安装成功

　　[bamboo@localhost jdk1.7.0_67]$ java -version

　　java version "1.7.0_67"

　　Java(TM) SE Runtime Environment (build 1.7.0_67-b01)

　　Java HotSpot(TM) 64-Bit Server VM (build 24.65-b04, mixed mode)

　　可以看到已经生效

4.安装 hadoop

4.1 解压 hadoop

tar -zxvf hadoop-2.5.0.tar.gz -C /opt/modules/

4.2 配置 hadoop-env.sh 环境变量

/opt/modules/hadoop-2.5.0/etc/hadoop/hadoop-env.sh

vim hadoop-env.sh

配置 jdk 路径

export JAVA_HOME=/opt/modules/jdk1.7.0_67

4.3 启动 hadoop (有 3 种启动方式)

4.3.1 切换到安装根目录，然后创建 input 目录

[bamboo@localhost hadoop-2.5.0]$ pwd

/opt/modules/hadoop-2.5.0

[bamboo@localhost hadoop-2.5.0]$ mkdir input

[bamboo@localhost hadoop-2.5.0]$ ls

bin etc include input lib libexec sbin share

4.3.2 把 etc/hadoop 下的 xml 文件 cp 到 input 目录下

[bamboo@localhost hadoop-2.5.0]$ cp etc/hadoop/*.xml input/

[bamboo@localhost hadoop-2.5.0]$ cd input/

[bamboo@localhost input]$ ls

capacity-scheduler.xml core-site.xml hadoop-policy.xml hdfs-site.xml httpfs-site.xml yarn-site.xml

4.3.3 启动 hadoop

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar grep input output 'dfs[a-z.]+'

执行成功，并没有报错

执行 ls,可以看到多了 output目录:

[bamboo@localhost hadoop-2.5.0]$ ls

bin etc include input lib libexec output sbin share

[bamboo@localhost hadoop-2.5.0]$ cat output/*

1 dfsadmin

测试一个统计字符的

mkdir wcinput

vim wcinput

hadoop yarn

hadoop mapreduce

hadoop hdfs

yarn nodemanager

hadoop resourcemanager

然后启动 hadoop:

[bamboo@localhost hadoop-2.5.0]$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar wordcount wcinput wcoutput

[bamboo@localhost hadoop-2.5.0]$ cat wcoutput/*

hadoop 4

hdfs 1

mapreduce 1

nodemanager 1

resourcemanager 1

yarn 2

[bamboo@localhost hadoop-2.5.0]$ cat wcinput/

cat: wcinput/: Is a directory

[bamboo@localhost hadoop-2.5.0]$ cat wcinput/*

hadoop yarn

hadoop mapreduce

hadoop hdfs

yarn nodemanager

hadoop resourcemanager

这个模式是 hadoop 的 Standalone Operation 启动模式.下一篇继续 Pseudo-Distributed Mode.

当然也可以参考官网的 getstart 文档，链接如下:

http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-common/SingleCluster.html

Hadoop 系列文章(一) Hadoop 的安装,以及 Standalone Operation 的启动模式测试的更多相关文章

Hadoop 系列文章(二) Hadoop配置部署启动HDFS及本地模式运行MapReduce
接着上一篇文章,继续我们 hadoop 的入门案例. 1. 修改 core-site.xml 文件 [bamboo@hadoop-senior hadoop-2.5.0]$ vim etc/hadoo ...
啃掉Hadoop系列笔记(03)-Hadoop运行模式之本地模式
Hadoop的本地模式为Hadoop的默认模式,不需要启用单独进程,直接可以运行,测试和开发时使用. 在<啃掉Hadoop系列笔记(02)-Hadoop运行环境搭建>中若环境搭建成功,则直 ...
hadoop系列一：hadoop集群安装
转载请在页首明显处注明作者与出处 http://www.cnblogs.com/zhuxiaojie/p/6384393.html 一:说明此为大数据系列的一些博文,有空的话会陆续更新,包含大数据 ...
啃掉Hadoop系列笔记(01)-Hadoop框架的大数据生态
一.Hadoop是什么 1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构 2)主要解决,海量数据的存储和海量数据的分析计算问题. 3)广义上来说,HADOOP通常是指一个更广泛的概 ...
Redis 学习笔记系列文章之 Redis 的安装与配置 (一)
1. 介绍 Redis is an open source (BSD licensed), in-memory data structure store, used as database, cach ...
安装Hadoop系列 — eclipse plugin插件编译安装配置
[一].环境参数 eclipse-java-kepler-SR2-linux-gtk-x86_64.tar.gz //现在改为eclipse-jee-kepler-SR2-linux-gtk-x86_ ...
Hadoop 系列文章(三) 配置部署启动YARN及在YARN上运行MapReduce程序
这篇文章里我们将用配置 YARN,在 YARN 上运行 MapReduce. 1.修改 yarn-env.sh 环境变量里的 JAVA_HOME 路径 [bamboo@hadoop-senior ha ...
Hadoop系列教程<一>---Hadoop是什么呢？
Hadoop适合应用于大数据存储和大数据分析的应用,适合于服务器几千台到几万台的集群运行,支持PB级的存储容量.Hadoop典型应用有:搜索.日志处理.推荐系统.数据分析.视频图像分析.数据保存等.但 ...
啃掉Hadoop系列笔记(04)-Hadoop运行模式之伪分布式模式
伪分布式模式等同于完全分布式,只是她只有一个节点. 一) HDFS上运行MapReduce 程序 (1)配置集群 (a)配置:hadoop-env.sh Linux系统中获取jdk的安装路径:

随机推荐

django之使用views.py里面的函数对表进行增删改查内容（models.py中表的创建、views.py中函数的使用，基于对象的跨表查询）
models之对于表的创建有以下几种: 一对一:ForeignKey("Author",unique=True), OneToOneField("Author" ...
gentoo 图像方面的软件
图像方面的软件一般包括:查看图像,屏幕截图,图像修改. 查看图像简单的可以安装 feh,但是 feh 一般作为墙纸来用.稍微好一些的是 gqview. 屏幕截图可以用 screengrab,使用的时候 ...
如何配置IIS使其支持APK文件的下载
在管理工具里打开Internet 信息服务(IIS)管理器.然后选择需要配置的网站. 右侧的界面中会显示该网站的所有功能配置,我们选择并点击进入“MIME类型” 在左侧的操作区选择点击“添加”MIME ...
BUILDING WITH BOOTSTRAP
BUILDING WITH BOOTSTRAP Bootstrap Generalizations You just built an impressive webpage using the Boo ...
Adreno GPU Profiler
Adreno GPU Profiler,除了UNITY profiler外的一个备选,似乎不能看CPU,内存?
[Ting's笔记Day2]在Github用Jekyll创建自己的blog
昨天工程师在我们共同的群组分享他的blog,他提到是使用Jekyll(一个简单静态blog网站生成器)架在github上的. 于是好奇的我决定照着关键字来搜寻一下,如法炮制做一个出来. 也可以放一份到 ...
ImportError: No module named pycocotools.coco,pycocotools/_mask.so: undefined symbol: _Py_ZeroStruct
准确的说是没有安装 pycocotools 可以借鉴下面链接: https://blog.csdn.net/ab0902cd/article/details/79085797 因为我通常用Python ...
Github（远程仓库） 2
远程仓库之前就添加好了今天弄了简单的查看远程库,提取远程库,在线修改以及本地更新修改,推送到远程仓库,删除远程仓库,参考http://www.runoob.com/git/git-remote-re ...
4、python常用基础类型介绍
1.字符串 str 描述性质的一种表示状态的例如名字 word='helloworld' print(type(word),word) <class 'str'> helloworld2. ...
大数据入门到精通11-spark dataframe 基础操作
// dataframe is the topic 一.获得基础数据.先通过rdd的方式获得数据 val ny= sc.textFile("data/new_york/")val ...

Hadoop 系列文章(一) Hadoop 的安装,以及 Standalone Operation 的启动模式测试

Hadoop 系列文章(一) Hadoop 的安装,以及 Standalone Operation 的启动模式测试的更多相关文章

随机推荐

热门专题