1 在虚拟机安装 Ubuntu

2 安装网络工具

Ubuntu最小化安装没有 ifconfig命令

sudo apt-get install net-tools

3 Ubuntu修改网卡名字

修改网卡名字为eth0

sudo vim /etc/network/interfaces

reboot

4 修改主机名

sudo vim /etc/hosts

最后还要分别修改  /etc/hostname

reboot

5 修改IP地址

在虚拟机的虚拟机编辑选项->虚拟网络网络编辑器->nat模式->更改设置->根据自己主机的网络改子网

reboot

6 设置 DNS 解析

不需解析

7 修改 hosts 文件

sudo vim /etc/hosts

8 将yum源改为阿里云

8.1先备份

8.2打开文件设置

sudo vim /etc/apt/sources.list

8.3更新

sudo apt-get update

 9 安装配置JDK

9.1 检查是否已经安装

下载JDK,将JDK拉到桌面

9.2 安装JDK包到下列文件

alien -ivh --prefix=/usr/apps jdk-8u201-linux-x64.rpm

9.3配置环境变量

sudo vim /etc/profile

10 克隆节点

 

如下图克隆出nobe3和nobe4

10.1修改新节点的IP

 根据步骤七修改

10.2修改主机名

步骤四

10.3其他节点进行类似操作

11  配置免密登录

11.1 生成密钥对

ssh-keygen

11.2下载openssh-server

sudo apt-get install openssh-server

11.3将密钥对配置到node2 node3 和node4

 12 添加Hadoop 用户

四个节点同时操作

sudo useradd hadoop

vsudo passwd hadoop

12.1为Hadoop用户添加sudo 权限

sudo vim /etc/sudoers

13 配置Hadoop

13.1安装文件上传工具

yum - y install lrzsz

13.2 在 /home/xue目录下新建apps文件夹,将源码压缩包上传到apps文件里

sudo mkdir /home/xue/apps

13.3解压

 tar -zxvf /home/xue/apps/hadoop-2.7.7.tar.gz

13.4 配置Hadoop环境变量

sudo vim /etc/profile

 #set hadoop environment
export HADOOP_HOME=/home/xue/apps/hadoop-2.7.7
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin 

13.5 将配置文件拷贝到node3,node4中

sudo scp /etc/profile node3:/etc/

13.6 同时操作所有节点,重新加载配置文件

source /etc/profile

13.7 配置各类 xml 文件

配置文件在所在目录 /home/xue/apps/hadoop-2.7.7/etc/hadoop

13.7.1 配置hadoop-env.sh

添加  JAVA_HOME=/usr/apps/javajdk1.8.0_181-amd64

13.7.2 配置 core-site.xml

13.7.3 配置 hdfs-site.xml

13.7.4 配置 mapred-site.xml.template

将 mapred-site.xml.template 修改 为 mapred-site.xml

13.7.5 配置 yarn-site.xml

13.7.6 修改slaves文件

13.8 把配置文件分发到各个节点

    scp -r apps node3:/home/xue/

13.9 格式化 NameNode

hdfs namenode -format

13.10 测试安装

13.10.1 将hadoop主目录授权给当前用户(各节点都操作一次)

   sudo chown -R xue /home/xue/hadoop

13.10.2 启动 HDFS

start-dfs.sh

13.10.3 启动  YARN

start-yarn.sh

14 完成最后步骤

14.1 网页管理界面

将node1,node2,node3,node4的IP地址添加到 windows 的 hosts 文件

14.2 登陆

在浏览器上登陆HDFS ,http://node2:50070

win10虚拟机搭建Hadoop集群(已完结)的更多相关文章

  1. virtualbox 虚拟3台虚拟机搭建hadoop集群

    用了这么久的hadoop,只会使用streaming接口跑任务,各种调优还不熟练,自定义inputformat , outputformat, partitioner 还不会写,于是干脆从头开始,自己 ...

  2. 虚拟机搭建Hadoop集群

    安装包准备 操作系统:ubuntu-16.04.3-desktop-amd64.iso 软件包:VirtualBox 安装包:hadoop-3.0.0.tar.gz,jdk-8u161-linux-x ...

  3. Mac上使用虚拟机搭建Hadoop集群

    一. mini安装一台centos到虚拟机上 安装过程参考这篇博客http://www.linuxdown.net/install/setup/2015/0906/4053.html 二. 修改网络配 ...

  4. 配置ssh免密登录遇到的问题——使用VMware多虚拟机搭建Hadoop集群

    搭建环境: 虚拟机 VMware12Pro      操作系统  centos6.8        hadoop 1.2.1 1.导入镜像文件,添加java环境 1.查看当前系统中安装的java,ls ...

  5. 使用Docker搭建Hadoop集群(伪分布式与完全分布式)

    之前用虚拟机搭建Hadoop集群(包括伪分布式和完全分布式:Hadoop之伪分布式安装),但是这样太消耗资源了,自学了Docker也来操练一把,用Docker来构建Hadoop集群,这里搭建的Hado ...

  6. 基于Docker快速搭建多节点Hadoop集群--已验证

    Docker最核心的特性之一,就是能够将任何应用包括Hadoop打包到Docker镜像中.这篇教程介绍了利用Docker在单机上快速搭建多节点 Hadoop集群的详细步骤.作者在发现目前的Hadoop ...

  7. spark集群搭建(三台虚拟机)——hadoop集群搭建(2)

    !!!该系列使用三台虚拟机搭建一个完整的spark集群,集群环境如下: virtualBox5.2.Ubuntu14.04.securecrt7.3.6_x64英文版(连接虚拟机) jdk1.7.0. ...

  8. 使用Windows Azure的VM安装和配置CDH搭建Hadoop集群

    本文主要内容是使用Windows Azure的VIRTUAL MACHINES和NETWORKS服务安装CDH (Cloudera Distribution Including Apache Hado ...

  9. 搭建Hadoop集群 (三)

    通过 搭建Hadoop集群 (二), 我们已经可以顺利运行自带的wordcount程序. 下面学习如何创建自己的Java应用, 放到Hadoop集群上运行, 并且可以通过debug来调试. 有多少种D ...

随机推荐

  1. sql关联查询—将一个表的查询结果作为新表进行查询操作

    例题:#  各个部门中 最高工资中最低的那个部门的 最低工资是多少? 先考虑取得各个部门最高工资 SELECT MAX(salary) AS max_salary,e.`department_id` ...

  2. Markdown教程<2> mermaid图形绘制(1)

    Markdown教程<2> mermaid图形绘制(1) 博客园中的markdown编辑器同时支持mermaid图表引擎与tex公式引擎,可以使用mermaid直接画出流程图,时序图,甘特 ...

  3. SQLAlchemy基本使用,创建表,增删改查

    基础语法 创建连接 from sqlalchemy import create_engine # 写法1 engine = create_engine("postgresql://scott ...

  4. 用arduino制作具有无限数据传输功能的气象站

    本项目是用arduino开源硬件,来快速制作具有无限数据传输功能的气象站,我之前做过一个带数据记录功能的气象站项目,这次算是升级和改进的版本. 第1步:构想 首先,需要增加从气象站到室内接收器的无线数 ...

  5. JS中 【“逻辑运算”,“面试题:作用域问题”,“dom对象”】这些问题的意见见解

    1.逻辑运算 ||  &&  ! ||:遇到第一个为true的值就中止并返回 &&:遇到第一个为false的值就中止并返回,如果没有false值,就返回最后一个不是fa ...

  6. Python开发【第九篇】: 并发编程

    内容概要 操作系统介绍 进程 线程 协程 二. 进程 python并发编程之多进程理论部分 在python程序中的进程操作 运行中的程序就是一个进程.所有的进程都是通过它的父进程来创建的.因此,运行起 ...

  7. Linux搭建DHCP服务器

    Linux搭建DHCP服务器   实验目标: 通过本实验掌握基于Linux的DHCP服务器搭建技能. 本实验包含内容为yum的认识与使用,磁盘挂载的概念与使用,DHCP原理及配置,systemctl服 ...

  8. CCPC2019江西省赛-Problem G.Traffic

    题目描述: /*纯手打题面*/ Avin is observing the cars at a crossroads.He finds that there are n cars running in ...

  9. Codeforces 348B:Apple Tree(DFS+LCM+思维)

    http://codeforces.com/contest/348/problem/B 题意:给一棵树,每个叶子结点有w[i]个苹果,每个子树的苹果数量为该子树所有叶子结点苹果数量之和,要使得每个结点 ...

  10. 从零开始基于go-thrift创建一个RPC服务

    Thrift 是一种被广泛使用的 rpc 框架,可以比较灵活的定义数据结构和函数输入输出参数,并且可以跨语言调用.为了保证服务接口的统一性和可维护性,我们需要在最开始就制定一系列规范并严格遵守,降低后 ...