hadoop集群的安装步骤和配置

hadoop是由java语言编写的，首先我们肯定要在电脑中安装jdk，配置好jdk的环境，接下来就是安装hadoop集群的步骤了，在安装之前需要创建hadoop用户组和用户，另外我此时使用的是一主（master）三从（slave1、slave2、slave3）。

1、创建Hadoop组和hadoop用户

[root@master ~]# groupadd hadoop
[root@master ~]# useradd -g hadoop hadoop

2、上传、解压hadoop压缩包和重名解压后的目录

切换到hadoop用户：

[root@master ~]# su – hadoop

上传hadoop安装包：

解压hadoop安装包和重命名解压目录：

[hadoop@master ~]$ tar -zxvf hadoop-1.0.4.tar.gz
[hadoop@master ~]$ mv hadoop-1.0.4 hadoop

3、配置hadoop的的配置文件

进入hadoop的conf目录：

[hadoop@master ~]$ cd hadoop
[hadoop@master hadoop]$ cd conf
[hadoop@master conf]$
[hadoop@master conf]$ ll
总用量 76
-rw-rw-r--. 1 hadoop hadoop 7457 10月 3 2012 capacity-scheduler.xml
-rw-rw-r--. 1 hadoop hadoop 535 10月 3 2012 configuration.xsl
-rw-rw-r--. 1 hadoop hadoop 178 10月 3 2012 core-site.xml
-rw-rw-r--. 1 hadoop hadoop 327 10月 3 2012 fair-scheduler.xml
-rw-rw-r--. 1 hadoop hadoop 2237 10月 3 2012 hadoop-env.sh
-rw-rw-r--. 1 hadoop hadoop 1488 10月 3 2012 hadoop-metrics2.properties
-rw-rw-r--. 1 hadoop hadoop 4644 10月 3 2012 hadoop-policy.xml
-rw-rw-r--. 1 hadoop hadoop 178 10月 3 2012 hdfs-site.xml
-rw-rw-r--. 1 hadoop hadoop 4441 10月 3 2012 log4j.properties
-rw-rw-r--. 1 hadoop hadoop 2033 10月 3 2012 mapred-queue-acls.xml
-rw-rw-r--. 1 hadoop hadoop 178 10月 3 2012 mapred-site.xml
-rw-rw-r--. 1 hadoop hadoop 10 10月 3 2012 masters
-rw-rw-r--. 1 hadoop hadoop 10 10月 3 2012 slaves
-rw-rw-r--. 1 hadoop hadoop 1243 10月 3 2012 ssl-client.xml.example
-rw-rw-r--. 1 hadoop hadoop 1195 10月 3 2012 ssl-server.xml.example
-rw-rw-r--. 1 hadoop hadoop 382 10月 3 2012 taskcontroller.cfg

这里的配置文件有core-site.xml,hadoop-env.sh,hdfs-site.xml,mapred-site.xml,masters,slaves都需要修改，下面是这几个配置文件的内容：

core-site.xml配置文件的内容：

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>fs.default.name</name>#++++hdfs的默认路径
<value>hdfs://master:9000</value>
</property>
</configuration>

hadoop-env.sh配置文件最后面添加的内容：

export JAVA_HOME=/usr/jdk #++++jdk的环境变量++++#

hdfs-site.xml配置文件的内容：

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>dfs.replication</name>#++++hdfs的备份数
<value>3</value>
</property>
<property>
<name>dfs.name.dir</name> #++++namenode的文件存储路径，包括edites、fsimage、fstime、VERSION
<value>/home/hadoop/hadoop/namenode/</value>
</property>
<property>
<name>dfs.data.dir</name> #++++datanode的存储路径，包含数据和数据的原信息。
<value>/home/hadoop/hadoop/data/</value>
</property>
<property>
<name>hadoop.tmp.dir</name> #++++mapreduce计算的中间结果的临时存储文件夹
<value>/home/hadoop/hadoop/tmp/</value>
</property>
<property>
<name>dfs.permissions</name>#++++认证策略
<value>false</value>
</property>
</configuration>

mapred-site.xml配置文件的内容：

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>mapred.job.tracker</name> #++++jobtracker的ip和端口
<value>master:9001</value>
</property>
<property>
<name>mapred.tasktracker.map.tasks.maximum</name> #++++maptask的最大数
<value>2</value>
</property>
<property>
<name>mapred.tasktracker.reduce.tasks.maximum</name> #++++reducetask的最大数
<value>2</value>
</property>
</configuration>

masters配置文件的内容：

master
#SecondaryNameNode的位置，可以配置多个

slaves配置文件的内容：

slave1#++++slave的ip或者域名
slave2
slave3

说明：这些配置文件都是事先配置好的，只要上传到conf目录下，替换之前的文件即可，采用这种方式是因为在Linux命令行下直接打开文件在里面输入内容更容易错并且不方便。这里还有一点需要注意，上面配置文件中存在的汉字是用于注释的，实际上传的文件是没有注释的，因为不支持汉字。

上传配置文件过程：

4、到这里hadoop就安装结束了，接下来就是将安装完成的hadoop发送到其他的虚拟机中。

[hadoop@master conf]$ scp -r /home/hadoop/hadoop hadoop@slave1:/home/hadoop
[hadoop@master conf]$ scp -r /home/hadoop/hadoop hadoop@slave2:/home/hadoop
[hadoop@master conf]$ scp -r /home/hadoop/hadoop hadoop@slave3:/home/hadoop

向另外三台机器发送hadoop，记住这里发送到另外一台机器的hadoop用户下，而非root用户下。发送完成，就意味着三台机器的hadoop都已经安装完成。

5、安装ssh

为了在master机器中启动集群中所有的hadoop，这里安装ssh是提供启动方便。

将slave1、slave2、slave3三台机器都切换到hadoop用户；

在slave1、slave2、slave3三台机器中执行ssh localhost，是为了生成.ssh目录，这个目录默认是隐藏的需要使用ll –a命令查看。

[hadoop@slave1 ~]$ ll -a
总用量 32
drwx------. 5 hadoop hadoop 4096 11月 20 23:09 .
drwxr-xr-x. 3 root root 4096 11月 20 22:20 ..
-rw-r--r--. 1 hadoop hadoop 18 7月 18 2013 .bash_logout
-rw-r--r--. 1 hadoop hadoop 176 7月 18 2013 .bash_profile
-rw-r--r--. 1 hadoop hadoop 124 7月 18 2013 .bashrc
drwxr-xr-x. 2 hadoop hadoop 4096 11月 12 2010 .gnome2
drwxr-xr-x. 14 hadoop hadoop 4096 11月 20 23:03 hadoop
drwx------. 2 hadoop hadoop 4096 11月 20 23:09 .ssh

在master机器中生成公钥和私钥：

进入.ssh目录，移除里面的known_hosts文件

[hadoop@master ~]$ cd .ssh
[hadoop@master .ssh]$ ll
总用量 4
-rw-r--r--. 1 hadoop hadoop 1209 11月 20 23:05 known_hosts
[hadoop@master .ssh]$
[hadoop@master .ssh]$ rm -rf known_hosts

生成公钥和私钥：

[hadoop@master .ssh]$ ssh-keygen -t rsa

出现需要输入内容的对话，一律回车，只到生成结束

把公钥放到认证列表中：

[hadoop@master .ssh]$ cat id_rsa.pub >> authorized_keys

此时.ssh目录下回多出一个文件authorized_keys

给authorized_keys文件授权：

[hadoop@master .ssh]$ chmod 600 authorized_keys

将authorized_keys文件发送到slave1、slave2、slave3的hadoop用户下的.ssh目录下：

[hadoop@master .ssh]$ scp ~/.ssh/authorized_keys hadoop@slave1:~/.ssh/
[hadoop@master .ssh]$ scp ~/.ssh/authorized_keys hadoop@slave2:~/.ssh/
[hadoop@master .ssh]$ scp ~/.ssh/authorized_keys hadoop@slave3:~/.ssh/

至此ssh就安装成功了。

6、启动hadoop，这里要注意，要使用hadoop用户，不能用root用户。

格式化集群：

[hadoop@master .ssh]$ hadoop namenode –format

启动集群：

[hadoop@master ~]$ start-all.sh
Warning: $HADOOP_HOME is deprecated.
starting namenode, logging to /home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-namenode-master.out
slave3: starting datanode, logging to /home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-datanode-slave3.out
slave2: starting datanode, logging to /home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-datanode-slave2.out
slave1: starting datanode, logging to /home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-datanode-slave1.out
The authenticity of host 'master (192.168.56.200)' can't be established.
RSA key fingerprint is 63:e7:e2:e1:ae:bb:59:f8:ec:e8:23:e0:22:3e:ac:16.
Are you sure you want to continue connecting (yes/no)? yes
master: Warning: Permanently added 'master,192.168.56.200' (RSA) to the list of known hosts.
master: starting secondarynamenode, logging to /home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-secondarynamenode-master.out
starting jobtracker, logging to /home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-jobtracker-master.out
slave2: starting tasktracker, logging to /home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-tasktracker-slave2.out
slave1: starting tasktracker, logging to /home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-tasktracker-slave1.out
slave3: starting tasktracker, logging to /home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-tasktracker-slave3.out

这样集群就启动成功了。

7、 jps命令测试是否安装成功

master机器：

[hadoop@master ~]$ jps
2372 JobTracker
2298 SecondaryNameNode
2128 NameNode
2471 Jps

slave1机器：

[hadoop@slave1 ~]$ jps
2185 Jps
2019 DataNode
2106 TaskTracker

slave2机器：

[hadoop@slave2 ~]$ jps
2101 TaskTracker
2183 Jps
2013 DataNode

slave3机器：

[hadoop@slave3 ~]$ jps
2115 TaskTracker
2211 Jps
2041 DataNode

至此hadoop集群的安装和启动就完成了，启动集群只需要在master机器上执行start-all.sh就可以。停止集群使用stop-all.sh命令。

安装和配置hadoop集群步骤的更多相关文章

Linux中安装配置hadoop集群
一. 简介参考了网上许多教程,最终把hadoop在ubuntu14.04中安装配置成功.下面就把详细的安装步骤叙述一下.我所使用的环境:两台ubuntu 14.04 64位的台式机,hadoop选择 ...
hadoop集群环境搭建之安装配置hadoop集群
在安装hadoop集群之前,需要先进行zookeeper的安装,请参照hadoop集群环境搭建之zookeeper集群的安装部署 1 将hadoop安装包解压到 /itcast/ (如果没有这个目录 ...
centos7配置hadoop集群
一:测试环境搭建规划: 主机名称 IP 用户 HDFS YARN hadoop11 192.168.1.101 hadoop NameNode,DataNode NodeManager hadoop1 ...
yum安装CDH5.5 Hadoop集群
1.环境说明系统环境: 系统环境:centos6.7 Hadoop版本:CDH5.5 JDK运行版本:1.7.0_67 集群各节点组件分配: 2.准备工作安装 Hadoop 集群前先做好下面的准备 ...
Redis 安装、配置、集群
1. Redis的安装 1.1. Redis的安装 Redis是c语言开发的. 安装redis需要c语言的编译环境.如果没有gcc需要在线安装.yum install gcc-c++ 安装步骤: ...
在 Linux 服务器上搭建和配置 Hadoop 集群
实验条件:3台centos服务器,jdk版本1.8.0,Hadoop 版本2.8.0 注:hadoop安装和搭建过程中都是在用户lb的home目录下,master的主机名为host98,slave的主 ...
zookeeper之一安装和配置(单机+集群)
这里我以zookeeper3.4.10.tar.gz来演示安装,安装到/usr/local/soft目录下. 一.单机版配置 1.安装和配置 #.下载 wget http://apache.fayea ...
linux配置hadoop集群
①安装虚拟机 ②为虚拟机添加共享文件右击已经安装好的虚拟机设置—>选项—>共享文件 ③配置映射 sudo nano /etc/network/interfaces 重启网络:sud ...
为Linux集群创建新账户，并配置hadoop集群
转自:http://blog.csdn.net/bluesky8640/article/details/6945776 之前装python.jdk.hadoop都是用的root账户,这是一个绝对的失策 ...

随机推荐

Python3 operator模块关联代替Python2 cmp() 函数
Python2 cmp() 函数描述 cmp(x,y) 函数用于比较2个对象,如果 x < y 返回 -1, 如果 x == y 返回 0, 如果 x > y 返回 1. Python ...
前端pc版的简单适配
我们都知道对于前端pc版本的适配是一个难题,大部分都是做的媒体查询.但是有时间公司不要媒体查询就是需要不管多大的屏幕都是满屏显示.我就在考虑为啥不用rem给pc端做个适配. 我是基于设计图是1920 ...
IdeaVim插件使用技巧--JetBrains Plugin Vim
在 IDEA Intellij小技巧和插件一文中简单介绍了一下IdeaVim插件.在这里详细总结一下这个插件在日常编程中的一些常用小技巧.供有兴趣使用这个插件,但对Vim还不十分熟悉的朋友参考.当然 ...
php安装php-redis扩展
下载安装php-redis扩展: 地址:https://github.com/phpredis/phpredis/ $ wget http://pecl.php.net/get/redis-3.1.2 ...
ssh 远程命令
远程拷贝文件,scp -r 的常用方法: 1.使用该命令的前提条件要求目标主机已经成功安装openssh-server 如没有安装使用 sudo apt-get install openssh-ser ...
HTTP学习之HTTP基础
学习HTTP技术,首先要了解它的在web通信中有哪些特点,起到什么作用.有哪些规范.都有什么功能. HTTP的特点 HTTP使用的是一种可靠的.快速响应的数据传输协议,用户一旦发起请求,Web服务器可 ...
echarts实用小技巧，控制字符串长度，限定整数等
限定横坐标文本字符长度 xAxis : [ axisLabel:{ formatter: function (value) { var maxlength=6; if (value.length> ...
初识python 字符串列表字典相关操作
python基础(一): 运算符: 算术运算: 除了基本的+ - * / 以外,还需要知道 : // 为取整除返回的市商的整数部分例如: 9 // 2 ---> 4 , 9.0 // ...
POJ1426 Find The Multiple 解题报告
参考:http://www.cnblogs.com/ACShiryu/archive/2011/07/24/2115356.html #include <iostream> #includ ...
nyoj 525 一道水题【字符串（分割）】
参考:https://blog.csdn.net/dxx_111/article/details/48154687 #include <iostream> #include <cst ...

安装和配置hadoop集群步骤

hadoop集群的安装步骤和配置

hadoop是由java语言编写的，首先我们肯定要在电脑中安装jdk，配置好jdk的环境，接下来就是安装hadoop集群的步骤了，在安装之前需要创建hadoop用户组和用户，另外我此时使用的是一主（master）三从（slave1、slave2、slave3）。

安装和配置hadoop集群步骤的更多相关文章

随机推荐

热门专题