hadoop 伪分布配置
配置 Hadoop 伪分布式
任务配置说明:
VMware 15
Centos 6.5
java -jdk 1.8
hadoop-2.6.0-cdh5.14.0.tar.gz
第一步
自行安装虚拟机
第二步 开始大配置
修改主机名和用户名
- vim /etc/sysconfig/network --(将HOSTNAME=) 改为master(主机的意思)
- vim /etc/hosts --(增加一行内容 ip master)
配置静态ip
- vim /etc/sysconfig/network-scripts/ifcfg-eth0
修改内容如下:
- DEVICE=eth0 (网卡名称)
HWADDR=00:0C:29:63:C3:47
TYPE=Ethernet
UUID=7cce5090-6637-40fc-a47e-9f5e2d561b46
ONBOOT=yes (必须设置 设置启动)
NM_CONTROLLED=yes
BOOTPROTO=static (静态)
IPADDR=192.168.65.21 --(你的ip)
NETMASK=255.255.255.0 --(子网掩码)
GATEWAY=192.168.65.1 --(网关)
DNS1=114.114.114.114 --(DNS)
- DEVICE=eth0 (网卡名称)
配置SSH无密码连接
关闭防火墙
- service iptables stop --(仅一次性关闭防火墙 再次开机防火墙就重新开启了)
- chkconfig iptables off --(永久关闭防火墙 防止重启防火墙自启动)
配置 SSH
安装 ssh
- yum install ssh
安装 rsync
- yum install rsync
启动 SSH 服务命令
- service sshd restart
检查 ssh 是否已经安装成功 可以执行 rpm -qa | grep openssh
出现
- [hadoop@master ~]$ rpm -qa | grep openssh
openssh-server-5.3p1-94.el6.x86_64
openssh-clients-5.3p1-94.el6.x86_64
openssh-5.3p1-94.el6.x86_64
openssh-askpass-5.3p1-94.el6.x86_64
- [hadoop@master ~]$ rpm -qa | grep openssh
代表成功
检查 rsync 是否安装成功 可执行 rpm -qa | grep rsync
出现
- [hadoop@master ~]$ rpm -qa | grep rsync
rsync-3.0.6-12.el6.x86_64
- [hadoop@master ~]$ rpm -qa | grep rsync
代表成功
生成 SSH 公钥 (只可以生成当前执行用户的秘钥)
- ssh-keygen -t rsa --(连续回车即可)
- ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop(用户名)@master(主机名)
验证 ssh master
4.配置 java 环境
安装 Java jdk
卸载初始系统存在的jdk
检查 是否安装了jdk
- rpm -qa | grep jdk
如果出现了返回值 那么使用 yum -y remove xxx(将返回值输入即可)
安装 JDK (需要实现上传)
- tar -zxvf jdk-8u221-linux-x64.tar.gz --(解压压缩包)
修改环境配置文件
vim /etc/profile
文件末尾添加
#java --(注释代表java)
- export JAVA_HOME=/home/hadoop/app/jdk1.8.0_221 --(你java安装目录)
export PATH=$PATH:$JAVA_HOME/bin
- export JAVA_HOME=/home/hadoop/app/jdk1.8.0_221 --(你java安装目录)
让配置文件修改后生效
- source /etc/profile
验证 java是否安装成功 --(输入java命令即可)
- [hadoop@master jdk1.8.0_221]$ java
如若返回一大页东西则安装成功 java -version可以查看当前java版本信息
5.配置 hadoop 环境
老样子 先解压
- tar -zxvf hadoop-2.6.0-cdh5.14.0.tar.gz
修改配置文件信息
进入 hadoop 配置文件目录 cd /home/hadoop/app/hadoop-2.6.0-cdh5.14.0/etc/hadoop/
修改 hadoop-env.sh 文件 末尾追加以下内容
- export JAVA_HOME=/home/hadoop/app/jdk1.8.0_221
- export HADOOP_HOME=/home/hadoop/app/hadoop-2.6.0-cdh5.14.0
修改 core-site.xml 文件
- <configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://master:9000</value>
</property>
</configuration>
- <configuration>
修改 hdfs-site.xml
- <configuration>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<property>
<name>dfs.name.dir</name>
<value>/home/hadoop/app/hadoop-2.6.0-cdh5.14.0/hdfs/name</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/home/hadoop/app/hadoop-2.6.0-cdh5.14.0/hdfs/data</value>
</property>
</configuration>
- <configuration>
修改 mapred-site.xml
可以看到我们目录中没有mapred-site.xml 我们可以通过模板拷贝出来一个
- cp mapred-site.xml.template mapred-site.xml
- vim mapred-site.xml
添加如下内容
- <configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
- <configuration>
修改 yarn-site.xml
- <configuration>
<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.resourcemanager.address</name>
<value>master:8080</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>master:8082</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
</configuration>
- <configuration>
修改 slaves
- master
至此,Hadoop 安装配置工作全部完成,为了能在任何路径下使用 Hadoop 命令,还需要配置环境变量
对 /etc/profile 追加如下信息
- export HADOOP_HOME=/home/hadoop/app/hadoop-2.6.0-cdh5.14.0
export PATH=$PATH:$HADOOP_HOME/bin
- export HADOOP_HOME=/home/hadoop/app/hadoop-2.6.0-cdh5.14.0
对 环境配置文件生效
- [hadoop@master hadoop]$ source /etc/profile
在第一次启动 Hadoop 之前,必须对 HDFS 格式化,执行命令
- [hadoop@master hadoop]$ hadoop namenode -format
第三步
启动 Hadoop
格式化 Hadoop 完成后,便可以启动 hadoop ,不过首先我们赋予脚本可执行权限
- [hadoop@master hadoop]$ chmod +x -R /home/hadoop/app/hadoop-2.6.0-cdh5.14.0/sbin
然后就可以启动集群了 执行启动脚本 --(进入hadoop的sbin脚本目录)
- [hadoop@master sbin]$ cd /home/hadoop/app/hadoop-2.6.0-cdh5.14.0/sbin
执行脚本
- [hadoop@master sbin]$ bash start-all.sh
最后检查要启动的节点是否正常启动
- [hadoop@master sbin]$ jps
9025 DataNode
9185 SecondaryNameNode
8899 NameNode
9335 ResourceManager
9432 NodeManager
9644 Jps
- [hadoop@master sbin]$ jps
至此 一切完成
第四步
我们可以打开浏览器查看我们的HDFS
如果 linux 有浏览器可以通过浏览器地址输入
- master:50070 --(即可访问)
如果 想在windows访问 打开浏览器
- linuxip:50070
例如我的:192.168.65.21:50070
- linuxip:50070
大功告成了
hadoop 伪分布配置的更多相关文章
- Hadoop伪分布配置与基于Eclipse开发环境搭建
国内私募机构九鼎控股打造APP,来就送 20元现金领取地址:http://jdb.jiudingcapital.com/phone.html内部邀请码:C8E245J (不写邀请码,没有现金送)国内私 ...
- centos 6.4-linux环境配置,安装hadoop-1.1.2(hadoop伪分布环境配置)
1 Hadoop环境搭建 hadoop 的6个核心配置文件的作用: core-site.xml:核心配置文件,主要定义了我们文件访问的格式hdfs://. hadoop-env.sh:主要配置我们的j ...
- hadoop2.6.0 + hbase-1.0.0 伪分布配置
1 基本配置 主机名: 192.168.145.154 hadoop2 ======= 2 etc/hadoop下文件配置 1)core-site.xml <configuration> ...
- Data - Hadoop伪分布式配置 - 使用Hadoop2.8.0和Ubuntu16.04
系统版本 anliven@Ubuntu1604:~$ uname -a Linux Ubuntu1604 4.8.0-36-generic #36~16.04.1-Ubuntu SMP Sun Feb ...
- Hadoop伪分布安装配置
安装环境: 系统:Ubuntu 14.10 64bit hadoop:2.5.1 jdk:1.8.0_11 安装步骤: 一.安装JDK 安装 jdk,并且配置环境以及设置成默认 sudo gedi ...
- hadoop伪分布安装
解压 将安装包hadoop-2.2.0.tar.gz存放到/home/haozhulin/install/目录下,并解压 #将hadoop解压到/home/haozhulin/install路径下,定 ...
- Hadoop伪分布安装详解(五)
目录: 1.修改主机名和用户名 2.配置静态IP地址 3.配置SSH无密码连接 4.安装JDK1.7 5.配置Hadoop 6.安装Mysql 7.安装Hive 8.安装Hbase 9.安装Sqoop ...
- hadoop 伪分布启动-fs格式化
1.独立模式(standalone|local) nothing! 本地文件系统. 不需要启用单独进程. 2.pesudo(伪分布模式) 等同于完全分布式,只有一个节点. SSH: //(Socket ...
- Hadoop伪分布搭建
一.伪分布式的搭建 1.准备Linux环境 1.0点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改 ...
随机推荐
- 思考设计SQL优化方案
一.优化的哲学 注:优化有风险,涉足需谨慎 1.优化可能带来的问题? 优化不总是对一个单纯的环境进行,还很可能是一个复杂的已投产的系统: 优化手段本来就有很大的风险,只不过你没能力意识到和预见到: 任 ...
- 浅谈C#中Tuple和Func的使用
为什么将Tuple和Func混合起来谈呢? 首先,介绍一下:Tuple叫做元组,是.Net Framwork4.0引入的数据类型,用来返回多个数值.在C# 4.0之前我们函数有多个返回值,通常是使用r ...
- 一些常用关键字的用法(一.static)
17:36:26 2020-04-05 又是充实的一天,刚刚开始学习不久java的我,从面向过程的语言转变到面向对象的语言,在思想上上还是需要花费很多时间转变的.今天学习到了这几个关键字了,觉得这几个 ...
- c语言 0与非0
------------恢复内容开始------------ 结论: 其它的编程语言中有布尔数据类型,并用百来表示逻辑真和逻辑假,C语言没有这个内置类度型,在C语言中真和假是用整型值来表示知的,0就表 ...
- docker中MySQL镜像数据,日志,配置持久化
Docker的MySQL8镜像, 实行数据持久化 version: '3.1' services: mysql-itoken-service-admin: restart: always image: ...
- Golang入门(1):安装与配置环境变量的意义
摘要 在几年前学习Java的时候,环境的配置就会劝退一部分的初学者.而对于Golang来说,也需要从环境的配置开始学起.这一篇文章将从如何安装Golang开始讲起,随后将会提到Golang中的环境变量 ...
- 【php】COOKIE和SESSION
一. COOKIE(小甜点,小饼干) a) 生活中的实例: i. 大保健的会员卡(记录你的姓名.性别.ID号码.手机号……) ii. 超市的会员卡(记录你的姓名,性别,会员积分) b) PHP当中的实 ...
- Python Requests-学习笔记(3)-处理json
JSON响应内容 Requests中也有一个内置的JSON解码器,助你处理JSON数据: r = requests.get('https://github.com/timeline.json') pr ...
- 好消息,vue3.0 进入 beta 阶段!
昨天,4 月 16 日,vue 3 正式进入 beta 阶段.同日,尤大参加了 State of Vue 的线上活动,以下是他上传到 google docs 上的 slides : State of ...
- shell 数组遍历加引号和不加引号的区别?
前言 shell 是一个比较神奇的国度,里面有太多的坑需要填,今天需要填的坑就是,数组遍历在使用时加了引号和不加引号的区别. 案例 解析: 不加引号,数组中元素间的“空格”就会编程换行符 加引号, ...