（六）hadoop系列之__hadoop分布式集群环境搭建

配置hadoop(master,slave1,slave2)

  说明：

  	NameNode: master

  	DataNode: slave1,slave2

  --------------------------------------------------------

   A. 修改主机的master 和 slaves

      i. 配置slaves

         # vi hadoop/conf/slaves

         添加：192.168.126.20

               192.168.126.30

               ...节点 ip

       ii. 配置master

         添加：192.168.126.10

               ...主机 ip

   -------------------------------------------------------- 

   B. 配置master  .xml文件

        i. 配置core-site.xml

		<?xml version="1.0"?>

		<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

		<!-- Put site-specific property overrides in this file. -->

		<configuration>

			<property>

        <name>hadoop.tmp.dir</name>

        <value>/home/had/hadoop/data</value>

        <description>A base for other temporary directories.</description>

			</property>

			<property>

				<name>fs.default.name</name>

				<value>hdfs://192.168.126.10:9000</value>

			</property>

		</configuration>

	 ii. 配置hdfs-site.xml

		<?xml version="1.0"?>

		<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

		<!-- Put site-specific property overrides in this file. -->

		<configuration>

			<property>

				<name>dfs.replication</name>

				<value>3</value>

				<description>Default block replication.

					The actual number of replications can be specified when the file is created.

					The default is used if replication is not specified in create time.

				</description>

			</property>

		</configuration>

	iii.mapred-site.xml

		 	<?xml version="1.0"?>

		 	<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

			<!-- Put site-specific property overrides in this file. -->

			<configuration>

				<property>

					<name>mapred.job.tracker</name>

					<value>192.168.126.10:9001</value>

				</property>

			</configuration>

		-------------------------------------------------------------

   C. 配置slave1,slave2 （同上）

       i. core-site.xml

       ii. mapred-site.xml

	 ---------------------------------------------------------------	

   D. 配置 master,slave1,slave2的hadoop系统环境

     	$ vi /home/hadoop/.bashrc

    	添加：

			export HADOOP_HOME=/home/hadoop/hadoop-0.20.2

			export HADOOP_CONF_DIR=$HADOOP_HOME/conf

			export PATH=/home/hadoop/hadoop-0.20.2/bin:$PATH

   ----------------------------------------------------------------

初始化文件系统：

注意：有时候会出现以下错误信息

。。。

11/08/18 17:02:35 INFO ipc.Client: Retrying connect to server: localhost/192.168.126 .10:9000. Already tried 0 time（s）.

Bad connection to FS. command aborted.

此时需要把根目录下的tmp文件里面的内容删掉，然后重新格式化即可。

启动Hadoop：

完成后进行测试：

测试

  $ bin/hadoop fs -put ./README.txt test1

  $ bin/hadoop fs -ls

  Found 1 items

  drwxr-xr-x   - hadoop supergroup          0 2013-07-14 00:51 /user/hadoop/test1

  $hadoop jar hadoop-0.20.2-examples.jar wordcount /user/hadoop/test1/README.txt output1

结果出现以下问题

注：测试过程当中会有一些错误信息。一下是我在安装的过程当中碰到的几个问题。

1.org.apache.hadoop.ipc.RemoteException: org.apache.hadoop.hdfs.server.namenode.SafeModeException: Cannot delete /home/hadoop/hadoop-datastore
/hadoop-hadoop/mapred/system/job_201307132331_0005. Name node is in safe mode.

关闭安全模式：

bin/hadoop dfsadmin -safemode leave

2.org.apache.hadoop.ipc.RemoteException: java.io.IOException: File /user/hadoop/test1/README.txt could only be replicated to 0 nodes, 
instead of 1

情况1. hadoop.tmp.dir 磁盘空间不足。

解决方法： 换个足够空间的磁盘即可。

情况2. 查看防火墙状态

/etc/init.d/iptables status

/etc/init.d/iptables stop//关闭所有的防火墙

情况3.先后启动namenode、datanode（我的是这种情况）

参考文章：http://sjsky.iteye.com/blog/1124545

最后执行界面如下：

查看hdfs运行状态（web）：http://192.168.126.10:50070/dfshealth.jsp

查看map-reduce信息（web）：http://192.168.126.10:50030/jobtracker.jsp

整个Hadoop集群搭建结束。

（六）hadoop系列之__hadoop分布式集群环境搭建的更多相关文章

Spark 1.6.1分布式集群环境搭建
一.软件准备 scala-2.11.8.tgz spark-1.6.1-bin-hadoop2.6.tgz 二.Scala 安装 1.master 机器 (1)下载 scala-2.11.8.tgz, ...
Hadoop完全分布式集群环境搭建
1. 在Apache官网下载Hadoop 下载地址:http://hadoop.apache.org/releases.html 选择对应版本的二进制文件进行下载 2.解压配置以hadoop-2.6 ...
ZooKeeper 完全分布式集群环境搭建
1. 搭建前准备示例共三台主机,主机IP映射信息如下: 192.168.32.101 s1 192.168.32.102 s2 192.168.32.103 s3 2.下载ZooKeeper, 以 ...
Kafka 完全分布式集群环境搭建
思路: 先在主机s1上安装配置,然后远程复制到其它两台主机s2.s3上, 并分别修改配置文件server.properties中的broker.id属性. 1. 搭建前准备示例共三台主机,主机IP映 ...
Hadoop伪分布式集群环境搭建
本教程讲述在单机环境下搭建Hadoop伪分布式集群环境,帮助初学者方便学习Hadoop相关知识. 首先安装Hadoop之前需要准备安装环境. 安装Centos6.5(64位).(操作系统再次不做过多描 ...
阿里云ECS服务器部署HADOOP集群（一）：Hadoop完全分布式集群环境搭建
准备: 两台配置CentOS 7.3的阿里云ECS服务器: hadoop-2.7.3.tar.gz安装包: jdk-8u77-linux-x64.tar.gz安装包: hostname及IP的配置: ...
Hadoop+HBase+ZooKeeper分布式集群环境搭建
一.环境说明集群环境至少需要3个节点(也就是3台服务器设备):1个Master,2个Slave,节点之间局域网连接,可以相互ping通,下面举例说明,配置节点IP分配如下: Hostname IP ...
Hadoop学习（一）：完全分布式集群环境搭建
1. 设置免密登录 (1) 新建普通用户hadoop:useradd hadoop(2) 在主节点master上生成密钥对,执行命令ssh-keygen -t rsa便会在home文件夹下生成 .ss ...
Spark 2.2.0 分布式集群环境搭建
集群机器: 1台装了 ubuntu 14.04的台式机 1台装了ubuntu 16.04 的笔记本 (机器更多时同样适用) 1.需要安装好Hadoop分布式环境参照:Hadoop分类 ...

随机推荐

sublime install package没反应，以及安装后没有出现install package选项
离线安装Package Control 一般出现这种问题的是网络原因,我们可以下载离线安装包连接地址:https://github.com/wbond/package_control 安装完成后解压 ...
[Err] ERROR: wrong record type supplied in RETURN NEXT
在写GP 输出不定长列数据表函数时,报了一个错,百思不得其解.在公司大佬帮助下,知道是什么鬼了.. 先看看例子吧: ---- 函数定义 CREATE OR REPLACE FUNCTION &quo ...
20155206 2016-2017-2 《Java程序设计》第4周学习总结
20155206 2006-2007-2 <Java程序设计>第4周学习总结教材学习内容总结继承: 避免多个类间重复定义共同行为,在编写程序的过程中可能会出现部分代码重复的现象,把重复 ...
20155223 2006-2007-2 《Java程序设计》第二周学习总结
20155223 2006-2007-2 <Java程序设计>第二周学习总结第三章内容总结 3.1 类型正如我所预料的情况一样:Java脱胎于C语言,就一定会留有和C语言相近或相同的语 ...
20155302 2016-2017-2 《Java程序设计》第十周学习总结
20155302 2016-2017-2 <Java程序设计>第十周学习总结教材学习内容总结网络编程的实质就是两个(或多个)设备(例如计算机)之间的数据传输. 网络最主要的优势在于共享 ...
20145209 实验二《Java面向对象程序设计》实验报告
20145209 实验二 <Java面向对象程序设计> 实验报告实验内容 1.初步掌握单元测试和TDD. 2.理解并掌握面向对象三要素:封装.继承.多态. 3.初步掌握UML建模. 4. ...
【转】线段树完全版 ~by NotOnlySuccess
载自:NotOnlySuccess的博客 [完全版]线段树很早前写的那篇线段树专辑至今一直是本博客阅读点击量最大的一片文章,当时觉得挺自豪的,还去pku打广告,但是现在我自己都不太好意思去看那篇文章 ...
Nginx入门篇（四）之常用配置解析
1.Nginx状态信息功能 Nginx的模块当中有一个ngx_http_stub_status_module模块,这个模块主要记录Nginx的基本访问信息,要使用该模块,需要在编译的时候增加http_ ...
[IOI2011]Race 点分治
[IOI2011]Race LG传送门点分治板子题. 直接点分治统计,统计的时候开个桶维护下就好了. 注(tiao)意(le)细(hen)节(jiu). #include<cstdio> ...
SQL优化避免索引失效
Oracle 索引的目标是避免全表扫描,提高查询效率,但有些时候却适得其反.例如一张表中有上百万条数据,对某个字段加了索引,但是查询时性能并没有什么提高,这可能是 oracle 索引失效造成的.or ...

（六）hadoop系列之__hadoop分布式集群环境搭建

（六）hadoop系列之__hadoop分布式集群环境搭建的更多相关文章

随机推荐

热门专题