CentOS 安装 Hadoop 手记

Download & Install

download hadoop from http://hadoop.apache.org/releases.html#Download

download zip file (not rpm)

[v 1.1.2 bin] http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-1.1.2/hadoop-1.1.2-bin.tar.gz

[v 2.0.5-alpha] http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.0.5-alpha/hadoop-2.0.5-alpha.tar.gz

[v 2.1.0-beta] ] http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.1.0-beta/hadoop-2.1.0-beta.tar.gz

tar vxf hado......gz

mv hado..... /usr/hadoop

创建用户 hadoop

$ useradd -d /home/hadoop -s /bin/bash hadoop

$ passwd hadoop

hadoop

可以把hadoop用户加入到 sudoer 中（使用 visudo命令），方便管理。

更改 /usr/hadoop 属主为 hadoop

chown -R hadoop:hadoop hadoop

cd /usr/hadoop

mkdir tmp

配置hadoop

hadoop配置目录 /usr/hadoop/conf

vim ./hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1.7.0_21

[debian] 的 openjdk 主目录 /usr/lib/jvm/java-7-openjdk-armhf/

Hadoop配置文件在conf目录下，之前的版本的配置文件主要是Hadoop-default.xml和Hadoop-site.xml。由于Hadoop发展迅速，代码量急剧增加，代码开发分为了core，hdfs和map/reduce三部分，配置文件也被分成了三个core-site.xml、hdfs-site.xml、mapred-site.xml。core-site.xml和hdfs-site.xml是站在HDFS角度上配置文件；core-site.xml和mapred-site.xml是站在MapReduce角度上配置文件。

core-site.xml，请先备份。【ip地址改成localhost也可】

vim core-site.xml

<configuration>

<property>

<name>hadoop.tmp.dir</name>

<value>/usr/hadoop/tmp</value>

<description>.</description>

</property>

<property>

<name>fs.default.name</name>

<value>hdfs://192.168.1.249:9000</value>

</property>

</configuration>

hdfs-site.xml

replication 是数据副本数量，默认为3，salve少于3台就会报错

<configuration>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<configuration>

mapred-site.xml

修改Hadoop中MapReduce的配置文件，配置的是JobTracker的地址和端口。

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>http://192.168.1.249:9001</value>

</property>

</configuration>

masters

127.0.0.1 #master的ip，如果是全分布模式，SecondaryNameNode在某台机器上，则该配置设定为SecondaryNameNode

slaves (主机上的文件),加入slave的hostname或者ip 如果是全分布模式，去掉 master （即namenode）

hostname

127.0.0.1

在 slave 机器数配置 slave

scp复制 mster 的 /usr/hadoop 到各个 slave 即可

环境变量

vim /etc/profile

export HADOOP_HOME=/usr/hadoop

export PATH=$PATH:$HADOOP_HOME/bin

vim ./hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1.7.0_10/

[note] debian 的 openjdk 主目录 /usr/lib/jvm/java-7-openjdk-armhf/

slaves 文件无需配置；

配置 ssh 无密码通信

yum instal openssh-server openssh openssh-client

各个服务器的 /home/hadoop/.ssh/authorized_keys

本机的公钥(id_rsa.pub)也要添加到本机的authorized_keys中

注意：

1 设置 authorized_keys 权限为 600 ，属主有rw权限，其他的必须没有w权限；

2 设置 vim /etc/ssh/sshd_config

RSAAuthentication yes # 启用 RSA 认证

PubkeyAuthentication yes # 启用公钥私钥配对认证方式

AuthorizedKeysFile .ssh/authorized_keys # 公钥文件路径（和上面生成的文件同）

重启ssh:service ssh restart // service ssh restart

测试本机登录：

ssh localhost

ssh 192.168.1.xxx

$ ssh-keygen

$ ls ~/.ssh

id_rsa id_rsa.pub

对应公钥/私钥

复制公钥到 authorized_keys

启动 Hadoop

格式化HDFS文件系统(master & slaves)

hadoop namenode -format

启动

在启动前关闭集群中所有机器的防火墙，不然会出现datanode开后又自动关闭

service iptables stop

启动：./bin/start-all.sh

首先启动namenode 接着启动datanode1，datanode2，…，然后启动secondarynamenode。再启动jobtracker，然后启动tasktracker1，tasktracker2，…。

启动 hadoop成功后，在 Master 中的 tmp 文件夹中生成了 dfs 文件夹，在Slave 中的 tmp 文件夹中均生成了 dfs 文件夹和 mapred 文件夹。

验证hadoop

jps

hadoop dfsadmin -report

网页查看集群信息

http://192.168.1.249:50030

http://192.168.1.249:50070

CentOS 安装 Hadoop 手记的更多相关文章

centos安装hadoop(伪分布式)
在本机上装的CentOS 5.5 虚拟机, 软件准备:jdk 1.6 U26 hadoop:hadoop-0.20.203.tar.gz ssh检查配置 [root@localhost ~]# ssh ...
腾讯云CentOS 安装 Hadoop 2.7.3
1.安装 jdk yum install java 2.安装maven wget http://mirrors.hust.edu.cn/apache/maven/maven-3/3.5.0/binar ...
CentOS 安装 Hadoop
原文地址:http://www.cnblogs.com/caca/p/centos_hadoop_install.html 下载和安装 download hadoop from http://ha ...
CentOS安装Hadoop
Hadoop的核心由3个部分组成: HDFS: Hadoop Distributed File System,分布式文件系统,hdfs还可以再细分为NameNode.SecondaryNameNode ...
CentOS安装Hive
1.环境和软件准备: hive版本:apache-hive-2.3.6-bin.tar.gz,下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/hive ...
CentOS下安装hadoop
CentOS下安装hadoop 用户配置添加用户 adduser hadoop passwd hadoop 权限配置 chmod u+w /etc/sudoers vi /etc/sudoers 在 ...
大数据系列（2）——Hadoop集群坏境CentOS安装
前言前面我们主要分析了搭建Hadoop集群所需要准备的内容和一些提前规划好的项,本篇我们主要来分析如何安装CentOS操作系统,以及一些基础的设置,闲言少叙,我们进入本篇的正题. 技术准备 VMwa ...
CentOS 7 Hadoop安装配置
前言:我使用了两台计算机进行集群的配置,如果是单机的话可能会出现部分问题.首先设置两台计算机的主机名 root 权限打开/etc/host文件再设置hostname,root权限打开/etc/hos ...
大数据——Hadoop集群坏境CentOS安装
前言前面我们主要分析了搭建Hadoop集群所需要准备的内容和一些提前规划好的项,本篇我们主要来分析如何安装CentOS操作系统,以及一些基础的设置,闲言少叙,我们进入本篇的正题. 技术准备 VMwa ...

随机推荐

php中0,空,null和false之间区别
$a = 0; $b="0"; $c= ''; $d= null; $e = false; echo "5个变量-原始测试类型"; var_dump($a);/ ...
线段树解LIS
先是nlogn的LIS解法 /* LIS nlogn解法 */ #include<iostream> #include<cstring> #include<cstdio& ...
Slave SQL_THREAD如何重放Relay log
复制的介绍: 根据日志定义的模式不一样,可以分为:Statement(SBR)模式,Row(RBR)格式或者是MIXED格式,记录最小的单位是一个Event,binlog日志前4个字节是一个magic ...
windows系统下ruby开发环境的搭建方法
ruby是一种简单快捷的面向对象的脚本语言,非常直观.下面说一下windows系统下ruby开发环境的搭建方法. 工具/原料 rubyinstaller.exe 方法/步骤 1 到如下网站去下载最新的 ...
[转] Java基础知识——Java语言基础
http://blog.csdn.net/loneswordman/article/details/9905931 http://blog.csdn.net/wanghuan203/article/d ...
BZOJ1258 [CQOI2007]三角形tri 模拟
欢迎访问~原文出处——博客园-zhouzhendong 去博客园看该题解题目传送门 - BZOJ1258 题意概括这种图中,一个三角形的三边如果被其他某一个三角形的一条边包括,那么我们说该三角形和 ...
Java Swing提供的文件选择对话框 - JFileChooser
JFileChooser() 构造一个指向用户默认目录的 JFileChooser. JFileChooser(File currentDirectory) 使 ...
python tkinter-消息框、对话框、文件对话框
python tkinter-消息框.对话框.文件对话框消息框导入 import tkinter import tkinter.messagebox #这个是消息框,对话框的关键提示消息框 ...
洛谷 P1433 吃奶酪【DFS】+剪枝
题目链接:https://www.luogu.org/problemnew/show/P1433 题目描述房间里放着n块奶酪.一只小老鼠要把它们都吃掉,问至少要跑多少距离?老鼠一开始在(0,0)点处 ...
pyrhon SQLite数据库
pyrhon SQLite数据库目录介绍导入模块创建数据库/打开数据库创建表在表中插入行查询/修改删除表中的行删除表介绍 Python SQLITE数据库是一款非常小巧的嵌入式开源 ...

CentOS 安装 Hadoop 手记

CentOS 安装 Hadoop 手记的更多相关文章

随机推荐

热门专题