[转]CentOS下安装伪分布式Hadoop-1.2.1

From: http://blog.csdn.net/yinan9/article/details/16805275

环境：CentOS 5.10（虚拟机下）

[root@localhost hadoop]# lsb_release -a

LSB Version:    :core-4.0-ia32:core-4.0-noarch:graphics-4.0-ia32:graphics-4.0-noarch:printing-4.0-ia32:printing-4.0-noarch

Distributor ID: CentOS

Description:    CentOS release 5.10 (Final)

Release:        5.10

Codename:       Final

准备

Jdk安装与配置

Oracle官网下载jdk，这里我下载的是jdk-6u45-linux-i586.bin，并上传到虚拟机上，使用root用户，执行以下命令创建文件夹，移动安装文件，执行安装。

mkdir /usr/java

mv/home/auxu/Desktop/jdk-6u45-linux-i586.bin /usr/java

cd /usr/java

./jdk-6u45-linux-i586.bin

配置环境变量

vi /etc/profile

加入

export JAVA_HOME=/usr/java/jdk1.6.0_45
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin

保存完毕之后，执行:

source /etc/profile

验证java配置

[root@localhost java]# java -version

java version "1.6.0_45"

Java(TM) SE Runtime Environment (build 1.6.0_45-b06)

Java HotSpot(TM) Client VM (build 20.45-b01, mixed mode, sharing)

可以简单写一个java class来进行测试，这里不多说明

创建Hadoop用户及相关应用文件夹

同样使用root用户创建一个名为hadoop的新用户

useradd hadoop

passwd hadoop

创建应用文件夹，以便进行之后的hadoop配置

mkdir /hadoop

mkdir /hadoop/hdfs

mkdir /hadoop/hdfs/data

mkdir /hadoop/hdfs/name

mkdir /hadoop/mapred

mkdir /hadoop/mapred/local

mkdir /hadoop/mapred/system

mkdir /hadoop/tmp

将文件夹属主更改为hadoop用户

chown -R hadoop /hadoop

设置Hadoop用户使之可以免密码ssh到localhost

su - hadoop

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

cat ~/.ssh/id_dsa.pub>> ~/.ssh/authorized_keys

cd /home/hadoop/.ssh

chmod 600 authorized_keys

注意这里的权限问题，保证.ssh目录权限为700，authorized_keys为600

验证：

[hadoop@localhost .ssh]$ ssh localhost
Last login: Sun Nov 17 22:11:55 2013

ssh localhost之后无需输入密码就可以连接，配置OK

安装配置Hadoop

创建目录并安装

重新切回root用户，创建安装目录

mkdir /opt/hadoop

将安装文件移动到以上新建目录，确保其执行权限，然后执行

mv /home/auxu/Desktop/hadoop-1.2.1.tar.gz /opt/hadoop

cd /opt/hadoop

tar -xzvf hadoop-1.2.1.tar.gz

将hadoop安装目录的属主更改为hadoop用户

chown -R hadoop /opt/hadoop

切换到hadoop用户，修改配置文件，这里根据前面创建的应用文件进行相关配置，依照各自情况而定

su - hadoop

cd /opt/hadoop/hadoop-1.2.1/conf

core-site.xml

<configuration>

<property>

<name>fs.default.name</name>

<value>hdfs://localhost:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/hadoop/tmp</value>

</property>

</configuration>

hdfs-site.xml

<configuration>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

<name>dfs.name.dir</name>

<value>/hadoop/hdfs/name</value>

</property>

<property>

<name>dfs.data.dir</name>

<value>/hadoop/hdfs/data</value>

</property>

</configuration>

mapred-site.xml

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>localhost:9001</value>

</property>

</configuration>

hadoop-env.sh

配置JAVA_HOME 与 HADOOP_HOME_WARN_SUPPRESS。

PS：HADOOP_HOME_WARN_SUPPRESS这个变量可以避免某些情况下出现这样的提醒 "WARM: HADOOP_HOME is deprecated”

export JAVA_HOME=/usr/java/jdk1.6.0_45

export HADOOP_HOME_WARN_SUPPRESS="TRUE"

source hadoop-env.sh

重新配置 /etc/profile 文件，最终如：

export JAVA_HOME=/usr/java/jdk1.6.0_45

export JRE_HOME=$JAVA_HOME/jre

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export HADOOP_HOME=/opt/hadoop/hadoop-1.2.1

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

使更新后的配置文件生效

source /etc/profile

测试hadoop安装

[hadoop@localhost conf]$ hadoop version

Hadoop 1.2.1

Subversion https://svn.apache.org/repos/asf/hadoop/common/branches/branch-1.2 -r 1503152

Compiled by mattf on Mon Jul 22 15:23:09 PDT 2013

From source with checksum 6923c86528809c4e7e6f493b6b413a9a

启动HADOOP

需要先格式化namenode，再启动所有服务

hadoop namenode -format
start-all.sh

查看进程

hadoop@localhost conf]$ jps

6360 NameNode

6481 DataNode

6956 Jps

6818 TaskTracker

6610 SecondaryNameNode

6698 JobTracker

如果能找到这些服务，说明Hadoop已经成功启动了。

如果有什么问题，可以去/opt/hadoop/hadoop-1.2.1/logs查看相应的日志

最后就可以通过以下链接访问haddop服务了
localhost:50030/   for the Jobtracker
localhost:50070/   for the Namenode
localhost:50060/   for the Tasktracker

Hadoop JobTracker:

Hadoop Namenode:

Hadoop TaskTracker:

PS：完全分布式的安装与伪分布式安装大同小异，注意如下几点即可

1.集群内ssh免用户登录

2.配置文件中指定具体的ip地址(或机器名)，而不是localhost

3.配置masters和slaves文件，加入相关ip地址(或机器名)即可

以上配置需要在各个节点上保持一致。

[转]CentOS下安装伪分布式Hadoop-1.2.1的更多相关文章

ubuntu 下安装伪分布式 hadoop
安装准备: (1)hadoop安装包:hadoop-1.2.1.tar.gz (2)jdk安装包:jdk-7u60-linux-i586.gz (3)要是须要eclipse开发的话还须要eclips ...
CentOS7上安装伪分布式Hadoop
1.下载安装包下载hadoop安装包官网地址:https://hadoop.apache.org/releases.html 版本:建议使用hadoop-2.7.3.tar.gz 系统环境:Cen ...
Ubuntu 14.10 下安装伪分布式hdoop 2.5.0
折腾了一天,其间配置SSH时候出现了问题,误删了ssh-keygen相关文件,导致配置SSH彻底萎了,又重装了系统.... 采用伪分布式模式,即hadoop将所有进程运行于同一台主机上,但此时Hado ...
Ubuntu 14.10 下安装伪分布式hbase 0.99.0
HBase 安装分为:单击模式,伪分布式,完全分布式,在单机模式中,HBase使用本地文件系统而不是HDFS ,所有的服务和zooKeeper都运作在一个JVM中.本文是安装的伪分布式. 安装步骤如下 ...
Ubuntu 14.10 下安装伪分布式hive-0.14.0
本地独立模式,MySQL作为元数据库 1 安装环境准备 1.1 安装JDK,在安装hadoop时候已经安装了,参考http://www.cnblogs.com/liuchangchun/p/40972 ...
VMwareWorkstation 平台 Ubuntu14 下安装配置伪分布式 hadoop
VMwareWorkstation平台Ubuntu14下安装配置伪分布式hadoop 安装VmwareStation 内含注册机. 链接:https://pan.baidu.com/s/1j-vKgD ...
CentOS下安装hadoop
CentOS下安装hadoop 用户配置添加用户 adduser hadoop passwd hadoop 权限配置 chmod u+w /etc/sudoers vi /etc/sudoers 在 ...
Linux单机环境下HDFS伪分布式集群安装操作步骤v1.0
公司平台的分布式文件系统基于Hadoop HDFS技术构建,为开发人员学习及后续项目中Hadoop HDFS相关操作提供技术参考特编写此文档.本文档描述了Linux单机环境下Hadoop HDFS伪分 ...
ubuntu安装伪分布式Hadoop3.1.2
作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3223 本文是基于已经安装好的ubuntu环境上搭建伪分布式hadoop,在 ...

随机推荐

SAE云平台上传图片和发送邮件
1.远程图片保存至Storage 其中public是Storage中的容器名,"目录1/目录2/"是容器下的路径 $file_content 是得到的文件数据 $s = new S ...
自动复制转换StringBuffer
自动复制转换StringBuffer http://www.cnblogs.com/coqn/archive/2012/07/31/all_StringBuufer.html http://blog. ...
ASP.NET MVC中ViewData、ViewBag和TempData
1.ViewData 1.1 ViewData继承了IDictionary<string, object>,因此在设置ViewData属性时,传入key必须要字符串型别,value可以是任 ...
Shell编程基础教程3--Shell输入与输出
3.Shell输入与输出 3.1.echo echo命令可以显示文本行或变量,或者把字符串输出到文件 echo [option] string ...
scala中的trait
这里的trait字面意思是特质或者特征,这个词翻译成特征比较合适.它的意义和java,c#中接口很类似.但是trait支持部分实现,也就是说可以在scala的trait中可以实现部分方法. 下面我们以 ...
git分支使用
1.查看远程服务器分支 git branch -a 2.查看本地分支 git branch 3.切换分支 git checkout master 4.删除远程分支 git push origin :b ...
win8.1/win10 UEFI + GPT 安装（测试机型：华硕S56CM）
本教程简要介绍在UEFI 启动模式下在GPT分区表中,最简单的方法安装 Windows 10 x64 位系统.(并非傻瓜教程,安装者总要有一定的经验基础)下面先简单介绍一下UEFI和GTP. UEFI ...
loj1011 状态压缩
题目链接:http://lightoj.com/volume_showproblem.php?problem=1011 思路:最近的开始做dp了...很明显的一道状态压缩题,dp[n][state]表 ...
UVA136 求第1500个丑数
枚举大范围数据..暴力检查题目条件 #include <iostream> #include <cstdio> #include <vector> #include ...
felx项目属性(二)
order flex-grow flex-shrink flex-basis flex align-self 1.1 order css order属性规定了弹性容器中的可伸缩项目在布局时的顺序.元素 ...

[转]CentOS下安装伪分布式Hadoop-1.2.1

[转]CentOS下安装伪分布式Hadoop-1.2.1的更多相关文章

随机推荐

热门专题