Hadoop安装及配置
一、系统及软件环境
1、操作系统
CentOS release 6.5 (Final)
内核版本:2.6.32-431.el6.x86_64
master.fansik.com:192.168.83.118
node1.fansik.com:192.168.83.119
node2.fansik.com:192.168.83.120
2、jdk版本:1.7.0_75
3、Hadoop版本:2.7.2
二、安装前准备
1、关闭防火墙和selinux
# setenforce 0
# service iptables stop
2、配置host文件
192.168.83.118 master.fansik.com
192.168.83.119 node1.fansik.com
192.168.83.120 node2.fansik.com
3、生成秘钥
master.fansik.com上执行# ssh-keygen一直回车
# scp ~/.ssh/id_rsa.pub node1.fansik.com:/root/.ssh/authorized_keys
# scp ~/.ssh/id_rsa.pub node2.fansik.com:/root/.ssh/authorized_keys
# chmod 600 /root/.ssh/authorized_keys
4、安装jdk
# tar xf jdk-7u75-linux-x64.tar.gz
# mv jdk1.7.0_75 /usr/local/jdk1.7
# vim /etc/profile.d/java.sh加入如下内容:
export JAVA_HOME=/usr/local/jdk1.7
export JRE_HOME=/usr/local/jdk1.7/jre
export CLASSPATH=.:$JAVA_HOME/lib:/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin
# source /etc/profile
5、同步时间(否则后边分析文件的时候可能会有问题)
# ntpdate 202.120.2.101(上海交通大学的服务器)
三、安装Hadoop
Hadoop的官方下载站点,可以选择相应的版本下载:http://hadoop.apache.org/releases.html
分别在三台机器上执行下面的操作:
# tar xf hadoop-2.7.2.tar.gz
# mv hadoop-2.7.2 /usr/local/hadoop
# cd /usr/local/hadoop/
# mkdir tmp dfs dfs/data dfs/name
四、配置Hadoop
master.fansik.com上的配置
# vim /usr/local/hadoop/etc/hadoop/core-site.xml
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://192.168.83.118:9000</value> </property> <property> <name>hadoop.tmp.dir</name> <value>file:/usr/local/hadoop/tmp</value> </property> <property> <name>io.file.buffer.size</name> <value>121702</value> </property> </configuration>
# vim /usr/local/hadoop/etc/hadoop/hdfs-site.xml
<configuration> <property> <name>dfs.namenode.name.dir</name> <value>file:/usr/local/hadoop/dfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/usr/local/hadoop/dfs/data</value> </property> <property> <name>dfs.replication</name> <value>2</value> </property> <property> <name>dfs.namenode.secondary.http-address</name> <value>192.168.83.118.9001</value> </property> <property> <name>dfs.webhdfs.enabled</name> <value>true</value> </property> </configuration>
# cp /usr/local/hadoop/etc/hadoop/mapred-site.xml.template /usr/local/hadoop/etc/hadoop/mapred-site.xml
# vim (!$|/usr/local/hadoop/etc/hadoop/mapred-site.xml)
<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> <property> <name>mapreduce.jobhistory.address</name> <value>192.168.83.118:10020</value> </property> <property> <name>mapreduce.jobhistory.webapp.address</name> <value>192.168.83.118:19888</value> </property> </configuration>
# vim /usr/local/hadoop/etc/hadoop/yarn-site.xml
<configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> <property> <name>yarn.resourcemanager.address</name> <value>192.168.83.118:8032</value> </property> <property> <name>yarn.resourcemanager.scheduler.address</name> <value>192.168.83.118:8030</value> </property> <property> <name>yarn.resourcemanager.resource-tracker.address</name> <value>192.168.83.118:8031</value> </property> <property> <name>yarn.resourcemanager.admin.address</name> <value>192.168.83.118:8033</value> </property> <property> <name>yarn.resourcemanager.webapp.address</name> <value>192.168.83.118:8088</value> </property> <property> <name>yarn.resourcemanager.resource.memory.mb</name> <value>2048</value> </property> </configuration>
# vim /usr/local/hadoop/etc/hadoop/slaves
192.168.83.119
192.168.83.120
将master上的etc目录同步至node1和node2
# rsync -av /usr/local/hadoop/etc/ node1.fansik.com:/usr/local/hadoop/etc/
# rsync -av /usr/local/hadoop/etc/ node2.fansik.com:/usr/local/hadoop/etc/
在master.fansik.com上操作即可,两个node会自动启动
配置Hadoop的环境变量
# vim /etc/profile.d/hadoop.sh
export PATH=/usr/local/hadoop/bin:/usr/local/hadoop/bin:$PATH
# source /etc/profile
初始化
# hdfs namenode -format
查看是否报错
# echo $?
启动服务
# start-all.sh
停止服务
# stop-all.sh
启动服务后即可通过下列地址访问:
http://192.168.83.118:8088
http://192.168.83.118:50070
五、测试Hadoop
在master.fansik.com上操作
# hdfs dfs -mkdir /fansik
如果在创建目录的时候提示下列的警告可以忽略
16/07/29 17:38:27 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your pform... using builtin-java classes where applicable
解决办法:
到下列站点去下载相应的版本即可:
http://dl.bintray.com/sequenceiq/sequenceiq-bin/
# tar -xvf hadoop-native-64-2.7.0.tar -C /usr/local/hadoop/lib/native/
如果提示:copyFromLocal:Cannot create directory /123/. Name node is in safe mode
说明Hadoop开启了安全模式,解决办法
hdfs dfsadmin -safemode leave
将myservicce.sh复制到fansik目录下
# hdfs dfs -copyFromLocal ./myservicce.sh /fansik
查看/fansik目录下是否有了myservicce.sh文件
# hdfs dfs -ls /fansik
使用workcount分析文件
# hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /fansik/myservicce.sh /zhangshan/
查看分析后的文件:
# hdfs dfs -ls /zhangshan/
Found 2 items
-rw-r--r-- 2 root supergroup 0 2016-08-02 15:19 /zhangshan/_SUCCESS
-rw-r--r-- 2 root supergroup 415 2016-08-02 15:19 /zhangshan/part-r-00000
查看分析结果:
# hdfs dfs -cat /zhangshan/part-r-00000
Hadoop安装及配置的更多相关文章
- [Hadoop入门] - 2 ubuntu安装与配置 hadoop安装与配置
ubuntu安装(这里我就不一一捉图了,只引用一个网址, 相信大家能力) ubuntu安装参考教程: http://jingyan.baidu.com/article/14bd256e0ca52eb ...
- Hadoop集群--linux虚拟机Hadoop安装与配置、克隆虚拟机
Hadoop集群 第四章 Hadoop安装与配置.克隆虚拟机 一.Hadoop安装与配置 1.将hadoop安装包通过Xftp传输到虚拟机的/software目录下 2.进入/software目录下, ...
- 一、hadoop安装与配置
准备环境: 系统:centos6.5 64位 192.168.211.129 master 192.168.211.131 slave1 在两台服务器上都要配置ssh免密码登录 在192. ...
- spark学习(2)--hadoop安装、配置
环境: 三台机器 ubuntu14.04 hadoop2.7.5 jdk-8u161-linux-x64.tar.gz (jdk1.8) 架构: machine101 :名称节点.数据节点.Secon ...
- Hadoop安装与配置
Hadoop介绍 上面是官方介绍,翻一下来总结一句话就是:Hadoop是一个高可用,用于分布式处理大规模计算的工具. Hadoop1.2 下载 . Hadoop1.2 安装 1. 安装jDK 2. 配 ...
- 五十九.大数据、Hadoop 、 Hadoop安装与配置 、 HDFS
1.安装Hadoop 单机模式安装Hadoop 安装JAVA环境 设置环境变量,启动运行 1.1 环境准备 1)配置主机名为nn01,ip为192.168.1.21,配置yum源(系统源) 备 ...
- hadoop安装及配置入门篇
声明: author: 龚细军 时间: -- 类型: 笔记 转载时请注明出处及相应链接. 链接地址: http://www.cnblogs.com/gongxijun/p/5726024.html 本 ...
- hadoop安装和配置
这里只是涉及了hadoop的一些思路,所以完全分布式配置文件并没有哦!以后会把详细的配置过程和使用环境补充在另外一篇博客中 hadoop的安装: --------------------------- ...
- cdh版本的hadoop安装及配置(伪分布式模式) MapReduce配置 yarn配置
安装hadoop需要jdk依赖,我这里是用jdk8 jdk版本:jdk1.8.0_151 hadoop版本:hadoop-2.5.0-cdh5.3.6 hadoop下载地址:链接:https://pa ...
随机推荐
- 两个APP跳转传值问题
最近工作上遇到个问题,新的项目要和老系统单点登录. 有点蒙,从来没做过,网上一搜都是SSO,还需要验证服务器. 仔细揣摩,其实需求很简单,没必要那么复杂,以下是我的需求和解决方案: 原系统AP1 新开 ...
- jquery如何根据text选择option
百度出来的代码都是这样的: $('#test option[text="b"]').attr("selected",true); 或 $('#test').fi ...
- 应用jacob组件造成的内存溢出解决方案(java.lang.OutOfMemoryError: Java heap space)
http://www.educity.cn/wenda/351088.html 使用jacob组件造成的内存溢出解决方案(java.lang.OutOfMemoryError: Java heap s ...
- HyperV采用硬盘拷贝的方式迁移虚拟机后的问题处理
公司有一台RSA认证服务器,是在windows 2008 R2下的虚拟机,最近总是出现服务中断的情况,考虑到宿主机性能较差,于是想迁移到新的服务器中. 本想通过SCVMM来迁移,但因功能不可用,所以采 ...
- jquery实现css3动画
jquery animate改变元素样式时,只支持数字值的变化,比如width,height等,但是css3属性状态值很多都不是数字值,而是字符串和数字混合在一起,比如translate(), rot ...
- 绝不在构造和析构函数中调用 virtual 函数
看下面的这段代码,问 print调用的是基类还是派生类的版本? 答案是 基类... 可能大家会很惊讶,print不是virtual function 吗?为什么不是调用派生类的版本呢? 首先,当定义一 ...
- Git简单应用(1)
Git是一个开源的分布式版本控制系统,用于敏捷高效地处理任何或小或大的项目. 1.Windows安装git msysgit是Windows版的Git,从https://git-for-windows. ...
- Unity自动场景保存脚本
新建一个名为AutoSave的编辑器脚本,并放于Assets/Editor下. using System; using UnityEditor; using UnityEditor.SceneMana ...
- BackTrack5-r3安装中文版的firefox火狐浏览器
在BT终端中输入:sudo apt-get install firefox 按回车在火狐地址栏里输入"about:config" 回车,点我同意.然后在过滤器里输入"ge ...
- ARM汇编
ARM汇编 ISA ISA即指指令集架构(Instruction Set Architecture)是与程序设计有关的计算机架构的一部分,包括本地数据类型.指令.寄存器.地址模式.内存架构.中断和意外 ...