【Hadoop】伪分布式安装

创建hadoop用户

创建用户命令：

sudo useradd -m hadoop -s /bin/bash

创建好后需要更改hadoop用户的密码，命令如下：

sudo passwd hadoop

然后给予hadoop用户sudo权限，方便配置部署。

这里使用编辑/etc/sudoers文件的方式，来赋权。在文件中添加一行hadoop ALL=(ALL) ALL，保存后完成赋值。

Java安装

安装Java的命令如下：

sudo yum install -y java-1.8.0-openjdk-devel

测试Java是否安装成功的命令：

java -version

结果如图所示：

此方法的JAVA_HOME环境变量为：

export JAVA_HOME=/etc/alternatives/java_sdk_1.8.0

SSH登入权限设置

首先需要安装SSH server，命令如下：

sudo yum install -y openssh-server

测试安装成功的命令：

ssh localhost

此时是需要密码登入的。

免密SSH登入

在hadoop用户下，输入如下命令：

ssh-keygen -t rsa                      # 会有提示，都按回车就可以

cat ./id_rsa.pub >> ./authorized_keys  # 加入授权

再次ssh local则不需要密码了。

Hadoop伪分布式安装

下载并解压

下载Hadoop，这里下载的版本是2.7.1。

将hadoop-2.7.1.tar.gz解压到/usr/local目录下。并修改文件名，修改文件权限。

tar -zxvf hadoop-2.7.1.tar.gz -C /usr/local

cd /usr/local/

sudo mv ./hadoop-2.6.0/ ./hadoop

sudo chown -R hadoop ./hadoop

检查Hadoop是否可用，在hadoop目录下输入下面命令：

./bin/hadoop version

结果如下：

伪分布式配置

Hadoop的配置文件位于/usr/local/hadoop/etc/hadoop/中，切换到此目录下，修改两个配置文件core-site.xml和hdfs-site.xml

core-size.xml文件的配置

修改为如下

<configuration>

    <property>

        <name>hadoop.tmp.dir</name>

        <value>file:/usr/local/hadoop/tmp</value>

        <description>Abase for other temporary directories.</description>

    </property>

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://localhost:9000</value>

    </property>

</configuration>

hdfs-site.xml文件的配置

修改为如下：

<configuration>

    <property>

        <name>dfs.replication</name>

        <value>1</value>

    </property>

    <property>

        <name>dfs.namenode.name.dir</name>

        <value>file:/usr/local/hadoop/tmp/dfs/name</value>

    </property>

    <property>

        <name>dfs.datanode.data.dir</name>

        <value>file:/usr/local/hadoop/tmp/dfs/data</value>

    </property>

</configuration>

名称节点格式化

配置完成后执行NameNode的格式化

cd /usr/local/hadoop

./bin/hdfs namenode -format

结果如下：

启动Hadoop

./sbin/start-all.sh

使用jps指令来检查是否启动成功

Word Count

在hdfs中创建/user/hadoop/input目录，命令如下：

./bin/hdfs dfs -mkdir -p /user/hadoop/input

文本file.txt：

Hello world! Hello Java! Hello Hadoop! Hello BigData!

将被计数的文本拷贝到hdfs的刚创建目录下，命令为：

./bin/hdfs dfs -put ./input/file.txt /user/hadoop/input

启动wordcount实例进行计数：

./bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount input output

查看结果

./bin/hdfs dfs -cat output/part-r-00000

参考

[1]Linux安装hadoop-2.7.1

【Hadoop】伪分布式安装的更多相关文章

hadoop伪分布式安装之Linux环境准备
Hadoop伪分布式安装之Linux环境准备一.软件版本 VMare Workstation Pro 14 CentOS 7 32/64位二.实现Linux服务器联网功能网络适配器双击选择VMn ...
apache hadoop 伪分布式安装
1. 准备工作 1.1. 软件准备 1.安装VMWare 2.在VMWare上安装CentOS6.5 3.安装XShell5,用来远程登录系统 4.通过rpm -qa | grep ssh 检查cen ...
Hadoop 伪分布式安装、运行测试例子
1. 配置linux系统环境 centos 6.4 下载地址:http://pan.baidu.com/s/1geoSWuv[VMWare专用CentOS.rar](安装打包好的VM压缩包) 并配置虚 ...
【Hadoop学习之二】Hadoop伪分布式安装
环境虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk8 hadoop-3.1.1 伪分布式就 ...
hadoop 伪分布式安装
0. 关闭防火墙重启后失效 service iptables start ;#立即开启防火墙,但是重启后失效. service iptables stop ;#立即关闭防火墙,但是重启后失效. 重启 ...
基于centos6.5 hadoop 伪分布式安装
步骤1:修改IP 地址和主机名: vi /etc/sysconfig/network-scripts/ifcfg-eth0 如果该文件打开为空白文件代表你计算机上的网卡文件不是这个名称“ifcfg-e ...
Hadoop伪分布式安装步骤（hadoop0.20.2版本）
最近在学习hadoop,自己下了个视频教程,他的教学版本是hadoop0.20.2版本,现在的最新版本都到了3.0了,版本虽然有点老,但是还是学了一下,觉得有借鉴的价值. 不废话了,开始介绍: 先说一 ...
[大数据] hadoop伪分布式安装
注意:节点主机的hostname不要带"_"等字符,否则会报错. 一.安装jdk rpm -i jdk-7u80-linux-x64.rpm 配置java环境变量: vi + /e ...
hadoop伪分布式安装
hadoop的伪分布安装:一台实体机或虚拟机的安装. 环境:Windows7.VMWare.CentOS 1.1 设置ip地址说明:在CentOS中的网络的类型: 仅主机模式:虚拟机在Windows ...
macbook 下hadoop伪分布式安装
1 准备原材料 1.1 jdk 1.8.0_171(事先安装并配置环境变量HAVA_HOME,PATH) 1.2 Hadoop 2.8.3 2 免密登陆配置(否则安装过程需要不断输入密码) 2.1 ...

随机推荐

快速解决Ubuntu/linux 环境下QT生成没有可执行文件（application/x-executable）
快速解决Ubuntu/linux 环境下QT生成没有可执行文件(application/x-executable)(转载) 问题描述与windows环境下不同,linux选择debug构建时并不 ...
UI自动化测试、接口测试等自动化测试策略
今天跟大家介绍UI测试.接口测试.单元测试主要内容,以及每种测试花费时间讨论.UI测试[Selenium]UI测试是最接近软件真实用户使用行为的测试类型.通常是模拟真实用户使用软件的行为,即模拟用户在 ...
e3mall商城的归纳总结2之认识dubbo、zookeeper
由于本项目用的是soa架构,因此必须需要两个系统之间进行通信,目前的解决办法有三种(本人认为) Webservice:效率不高基于soap协议.项目中不推荐使用. 使用restful形式的服务:htt ...
详细了解JS Map，它和传统对象有什么区别？
转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者.原文出处:https://www.codeproject.com/Articles/5278387/Under ...
Pytest-allure 生成美观好看的测试报告
在我们使用pytest-allure生成测试报告时,需要分为以下几步来执行 1.pytest TestCal.py --alluredir=/tmp/my_allure_results[这一步,是设置 ...
敏捷转型谁先动：老总，项目经理or团队
摘要: 敏捷转型成功的企业究竟是从老总开始?还是从项目经理开始?还是团队本身具有这种意识?相信还有很多想要转型敏捷的公司都存在这样的疑问. 从06年首届敏捷中国开发者大会召开到现在,敏捷方法在国内的应 ...
Mybatis 枚举类处理
目录类型处理器(TypeHandler) 内置的枚举处理器 EnumTypeHandler源码自定义枚举类处理通用枚举处理器 Git 类型处理器(TypeHandler) 无论是 MyBatis ...
深入了解Netty【四】IO模型
引言 IO模型就是操作数据输入输出的方式,在Linux系统中有5大IO模型:阻塞式IO模型.非阻塞式IO模型.IO复用模型.信号驱动式IO模型.异步IO模型. 因为学习Netty必不可少的要了解IO多 ...
跟着兄弟连系统学习Linux-【day01】
day01-20200527 p1.unix发展历史 (1960,有一个实验室,三个团队组成,开发了Unix雏形,但是因为没有办法发版,所以就荒废了.这个小组里面有一个人,打游戏的时候 ...
(Python)正则表达式进行匹配
import os import re pattern=re.compile(r'(\d{4})-(\d{2})-(\d{2})-b(\d{3})') // 要匹配的目录格式 for root,dir ...