Hadoop伪分布式搭建

1.准备Linux环境

①开启网络,ifconfig指令查看ip

②修改主机名为自己名字(hadoop)

vim /etc/sysconfig/network

NETWORKING=yes

HOSTNAME=hadoop

③修改主机名和IP的映射关系

vim /etc/hosts

192.168.182.128 hadoop

④关闭防火墙

#查看防火墙状态

service iptables status

#关闭防火墙

service iptables stop

#关闭防火墙开机启动

chkconfig iptables off

⑤重启Linux

reboot

安装JDK

安装自己的JDK前,删除openJDK:

查看java安装版本:java -version

查看java安装包:rpm -qa|grep java

删除java安装包:rpm -e --nodeps 包名

2.安装JDK

①filezilla上传jdk到/opt

②解压jdk

cd /opt

tar -zxvf jdk-7u76-linux-x64.tar.gz

③将java添加到环境变量中

vim /etc/profile

#在文件最后添加

export JAVA_HOME=/opt/jdk1.7.0_76

export PATH=$PATH:$JAVA_HOME/bin

④刷新配置

source /etc/profile

⑤查看java的版本

java -version

安装hadoop

3.安装Hadoop

①filezilla上传hadoop安装包,配置文档(hadoop2.2.0伪分布式搭建.txt)

3.2解压hadoop安装包

	#解压

	tar -zxvf hadoop-2.2.0.tar.gz

3.3修改配置文件（5个） 路径:/opt/hadoop-2.2.0/etc/hadoop

	第一个：hadoop-env.sh

	#在27行修改

	export JAVA_HOME=/opt/jdk1.7.0_76

	第二个：core-site.xml

	<configuration>

		<!-- 指定HDFS老大（namenode）的通信地址 -->

		<property>

				<name>fs.defaultFS</name>

				<value>hdfs://localhost:9000</value>

		</property>

		<!-- 指定hadoop运行时产生文件的存储路径 -->

		<property>

				<name>hadoop.tmp.dir</name>

				<value>/opt/hadoop-2.2.0/tmp</value>

		</property>

	</configuration>

	第三个：hdfs-site.xml

	<configuration>

		<!-- 设置hdfs副本数量 -->

		<property>

				<name>dfs.replication</name>

				<value>1</value>

		</property>

	</configuration>

	第四个：mapred-site.xml.template 需要重命名： mv mapred-site.xml.template mapred-site.xml

	<configuration>

		<!-- 通知框架MR使用YARN -->

		<property>

				<name>mapreduce.framework.name</name>

				<value>yarn</value>

		</property>

	</configuration>

	第五个：yarn-site.xml

	<configuration>

		<!-- reducer取数据的方式是mapreduce_shuffle -->

		<property>

			<name>yarn.nodemanager.aux-services</name>

			<value>mapreduce_shuffle</value>

		</property>

	</configuration>

3.4将hadoop添加到环境变量

	vim /etc/profile

	export JAVA_HOME=/opt/jdk1.7.0_55

	export HADOOP_HOME=/opt/hadoop-2.2.0

	export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

	source /etc/profile

3.5格式化HDFS（namenode）第一次使用时要格式化

	hadoop namenode -format

3.6启动hadoop

	先启动HDFS

	start-dfs.sh

	再启动YARN

	start-yarn.sh

3.7验证是否启动成功

	使用jps命令验证

	27408 NameNode

	28218 Jps

	27643 SecondaryNameNode

	28066 NodeManager

	27803 ResourceManager

	27512 DataNode

	http://localhost:50070  (HDFS管理界面)

	http://localhost:8088 （MR管理界面）

4.配置ssh免登陆

生成ssh免登陆密钥

cd ~，进入到我的home目录

cd .ssh/

ssh-keygen -t rsa （四个回车）

执行完这个命令后，会生成两个文件id_rsa（私钥）、id_rsa.pub（公钥）

将公钥拷贝到要免登陆的机器上

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

或

ssh-copy-id -i localhost

Hadoop安装部署的更多相关文章

记一次Hadoop安装部署过程
实验名称:Hadoop安装部署一.实验环境: 虚拟机数量:3个 (1个master,2个slave:slave01,slave02) 主节点master信息: 操作系统:CentOS7.5 软件包位 ...
zookeeper,hadoop安装部署其实与防火墙无关
网上查看了很多人关于hadoop,zookeeper的文章,大多都把关闭防火墙作为首要前提,个人觉得这大可不必. 首先你需要知道你部署的是什么东西,它需要哪些端口即可.把相关端口打开就可以了啊.然后把 ...
Hadoop安装-部署-测试
一:准备Linux环境[安装略] a.修改主机名 vim /etc/sysconfig/network NETWORKING= ...
Hadoop+Hbas完全分布式安装部署
Hadoop安装部署基本步骤: 1.安装jdk,配置环境变量. jdk可以去网上自行下载,环境变量如下: 编辑 vim /etc/profile 文件,添加如下内容: export JAVA_HO ...
安装部署Apache Hadoop (本地模式和伪分布式)
本节内容: Hadoop版本安装部署Hadoop 一.Hadoop版本 1. Hadoop版本种类目前Hadoop发行版非常多,有华为发行版.Intel发行版.Cloudera发行版(CDH)等, ...
hadoop 安装过程记录
1)首先配置好了四个linux虚拟机 root pwd:z****l*3 关闭了防火墙开通了 sshd服务开通了 ftp服务配置了 jdk 1.8 配置好了互信 (之前配置的过程忘了!--检查了 ...
CentOS 6.5 x64下Hadoop安装
Apache Hadoop安装部署模式单机(本地)模式(Standalone Mode) 伪分布模式(Pseudo-Distributed Mode) 完全分布模式(Fully Distribute ...
Hadoop2.7.3+Hbase-1.2.6+spark2.1.2完全分布式安装部署
https://www.cnblogs.com/lzxlfly/p/7221890.html 总的下载地址: http://mirror.bit.edu.cn/apache/ hadoop下 ...
hadoop入门（3）——hadoop2.0理论基础：安装部署方法
一.hadoop2.0安装部署流程 1.自动安装部署:Ambari.Minos(小米).Cloudera Manager(收费) 2.使用RPM包安装部署:Apache ...

随机推荐

SpringBoot整合RabbitMQ-5.7-课堂笔记-02
SpringBoot——两种传参方式
?传参举例:http://localhost:8082/news/asset/getDatas?page=1&keyWord=123&year=2020 注解:@RequestPar ...
python练习册每天一个小程序第0008题
1 # -*-coding:utf-8-*- 2 __author__ = 'Deen' 3 ''' 4 题目描述: 5 一个HTML文件,找出里面的正文. 6 7 思路: 8 利用Beautiful ...
Golang之框架篇-Windows环境bee工具运行beego
bee工具简介及好处 bee 工具是一个为了协助快速开发 beego 项目而创建的项目,通过 bee 你可以很容易的进行 beego 项目的创建.热编译.开发.测试.和部署. 强烈推荐新手或J ...
『现学现忘』Docker基础 — 35、实战：自定义CentOS镜像
目录 1.前提说明 2.编写Dockerfile文件 3.构建镜像 4.运行镜像 5.列出镜像的变更历史 1)目标:自定义镜像wokong_centos. 2)所用到的保留字指令: FROM:基础镜像 ...
class文件和java文件区别
Java 中 sleep 方法和 wait 方法的区别？
虽然两者都是用来暂停当前运行的线程,但是 sleep() 实际上只是短暂停顿,因为它不会释放锁,而 wait() 意味着条件等待,这就是为什么该方法要释放锁,因为只有这样,其他等待的线程才能在满足条件 ...
redis 过期键的删除策略？
1.定时删除:在设置键的过期时间的同时,创建一个定时器 timer). 让定时器在键的过期时间来临时,立即执行对键的删除操作. 2.惰性删除:放任键过期不管,但是每次从键空间中获取键时,都检查取得的 ...
指出在 spring aop 中 concern 和 cross-cutting concern 的不同之处?
concern 是我们想要在应用程序的特定模块中定义的行为.它可以定义为我们想要实现的功能. cross-cutting concern 是一个适用于整个应用的行为,这会影响整个应用程序. 例如,日 ...
Spring的@Enable*注解的工作原理
转自:https://blog.csdn.net/chengqiuming/article/details/81586948 一列举几个@Enable*注解的功能 @EnableAspectJAut ...

Hadoop安装部署

Hadoop伪分布式搭建

Hadoop安装部署的更多相关文章

随机推荐

热门专题