Hadoop 3.1.2 下载安装和分布式搭建的准备
官方有详细文档:https://hadoop.apache.org/docs/r3.1.2/hadoop-project-dist/hadoop-common/SingleCluster.html
我整个配置用的是ubuntu18.04 + java8 + hadoop3.1.2
首先我们可以创建一个hadoop用户,使用bash作为shell
sudo useradd -m hadoop -s /bin/bash
更改密码
sudo passwd hadoop
给hadoop管理员权限
sudo adduser hadoop sudo
接下来就登录在hadoop用户中操作吧 su hadoop
然后我们配置一下ssh
安装ssh
sudo apt install openssh-server
用 ssh localhost 试试能不能ssh登录本机,让后用 exit 登出
如果成攻了,就设置一下免密登录
cd ~/.ssh/ 移动到.ssh目录,如果显示不存在就ssh登录本机再试下
ssh-keygen -t rsa 一直按回车就行
cat ./id_rsa.pub >> ./authorized_keys 把id_rsa.pub复制到authorized_keys,加入授权
然后就可以ssh登录本机测试一下能不能免密登录
接下来安装jdk,我选择的是java8
jdk有3种装法,我就介绍最简单的一种
直接用apt安装就好
sudo apt-get install openjdk--jdk -C /usr/lib
然后我们配置一下环境变量
在linux中既可以在.bashrc中也可以在profile中配置
我们选择在 /etc/profile 中配置,在这里配置会在一开机就对全部用户生效,如果选择在 ~/.bashrc 配置,就是当前用户开启bash后生效
linux中的路径用 : 隔开
在文件末尾添加
export JAVA_HOME=/usr/lib/jvm/java--openjdk-amd64
export CLASSPATH=$JAVA_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$PATH
记得用 source 命令更新一下
接下来就是安装Hadoop了
由于apt没有自带hadoop,我们只能用 wget url 命令来下载在当前目录
官方url:https://archive.apache.org/dist/hadoop/common/hadoop-3.1.2/hadoop-3.1.2.tar.gz
清华镜像站:http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-3.1.2/hadoop-3.1.2.tar.gz
选择一个就好,推荐清华镜像站,官方的国内下载很慢
解压
tar -zxvf hadoop-3.1..tar.gz -C ~/
我们配置一下hadoop环境在hadoop-3.1.2目录下的 /etc/hadoop/hadoop-env.sh
按文件里说的,在JAVA_HOME哪里添加你的JAVA目录
我们进入hadoop目录下检查一下安装成功了没
cd ~/hadoop-3.1. 进入目录
./bin/hadoop version 检查版本
如上界面就是成功了
接下来就可以正式开始配置单机模式,伪分布式,或者完全分布式了
单机模式:在一台机上,没有用到分布式系统,多用于测试
伪分布式:在一台机上,用多个java程序模拟分布式的过程,也就是你在一个机器上配置了hadoop的所有节点
完全分布式:就是最常用的真正的分布式了
Hadoop 3.1.2 下载安装和分布式搭建的准备的更多相关文章
- Python 3 下载安装和环境搭建
Python3 下载 由于博主使用的平台是Windows10,以下方法仅限win10系统 Python 官网:https://www.python.org/ 找到跟系统相应的版本瞎子: Python ...
- Django web框架 下载安装 简单项目搭建
什么是web应用? Web应用程序是一种可以通过Web访问的应用程序,程序的最大好处是用户很容易访问应用程序,用户只需要有浏览器即可,不需要再安装其他软件 应用程序有两种模式C/S.B/S.C/S是客 ...
- Hadoop入门进阶课程1--Hadoop1.X伪分布式安装
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,博主为石山园,博客地址为 http://www.cnblogs.com/shishanyuan ...
- Hadoop介绍及最新稳定版Hadoop 2.4.1下载地址及单节点安装
Hadoop介绍 Hadoop是一个能对大量数据进行分布式处理的软件框架.其基本的组成包括hdfs分布式文件系统和可以运行在hdfs文件系统上的MapReduce编程模型,以及基于hdfs和MapR ...
- hadoop入门篇-hadoop下载安装教程(附图文步骤)
在前几篇的文章中分别就虚拟系统安装.LINUX系统安装以及hadoop运行服务器的设置等内容写了详细的操作教程,本篇分享的是hadoop的下载安装步骤. 在此之前有必要做一个简单的说明:分享的所有内容 ...
- ubuntu 下安装伪分布式 hadoop
安装准备: (1)hadoop安装包:hadoop-1.2.1.tar.gz (2)jdk安装包:jdk-7u60-linux-i586.gz (3)要是须要eclipse开发的话 还须要eclips ...
- hadoop安装教程,分布式配置 CentOS7 Hadoop3.1.2
安装前的准备 1. 准备4台机器.或虚拟机 4台机器的名称和IP对应如下 master:192.168.199.128 slave1:192.168.199.129 slave2:192.168.19 ...
- 一步步教你Hadoop多节点集群安装配置
1.集群部署介绍 1.1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台.以Hadoop分布式文件系统HDFS(Hadoop Distributed Filesys ...
- Ubuntu 14.04 (32位)上搭建Hadoop 2.5.1单机和伪分布式环境
引言 一直用的Ubuntu 32位系统(准备下次用Fedora,Ubuntu越来越不适合学习了),今天准备学习一下Hadoop,结果下载Apache官网上发布的最新的封装好的2.5.1版,配置完了根本 ...
随机推荐
- python多线程编程5: 条件变量同步-乾颐堂
互斥锁是最简单的线程同步机制,Python提供的Condition对象提供了对复杂线程同步问题的支持.Condition被称为条件变量,除了提供与Lock类似的acquire和release方法外,还 ...
- eigen安装
https://blog.csdn.net/liuxiaoheng1992/article/details/54410148
- Java 设计模式系列(四)生成器模式
Java 设计模式系列(四)生成器模式 生成器模式也称之为建造者模式.将一个复杂对象的构建与它的表示分离,使得同样的构建过程可以创建不同的表示.demo 1. 生成器模式原理 1.1 生成器模式结构 ...
- web02
高内聚,低耦合 写what 不写how 我们只关心他是什么,得到什么,我们并不关心怎么去得到的 ,那个细节去怎么得的, 都应该在这个层面上屏蔽掉,要关心的时候在点进去,这样就一层层的结构良好的代码 d ...
- windows-x64 php5.6+apache2.4+mysql配置
随手一记, 方便以后查找! 1.安装apache2.4 - 下载压缩文件并解压到 D:\Develop\Apache24 - 修改 conf 目录下: httpd.conf 文件 - 服务器目录: ...
- Web Api 中返回JSON的正确做法(转)
出处:http://www.cnblogs.com/acles/archive/2013/06/21/3147667.html 在使用Web Api的时候,有时候只想返回JSON:实现这一功能有多种方 ...
- kali下搭建WiFi钓鱼热点
在linux下建立无线热点并不像在windows下开启网络共享或者使用无线网卡驱动设置AP模式即可. linux下的无线共享要用到两个软件:hostapd(创建无线热点).dnsmasq(dns服务和 ...
- [label][Apache] VirtualHost
<VirtualHost *:80> ServerName localhost DocumentRoot "D:\www"</VirtualHos ...
- IntentService介绍
1.IntentService 是什么 一个封装了HandlerThread和Handler的异步框架. 是一种特殊Service,继承自Service,是抽象类,必须创建子类才可以使用. 可用于执行 ...
- C#泛型使用小记
最近C#的泛型使用频次略多,特在此记下一个印象深刻的. 情景如下, 基类BaseClass 有一系列的子类 SubClass1, SubClass2, SubClass3... 且其构造函数的参数较多 ...