VirtualBox虚拟机

下载地址

下载择操作系统对应的基础安装包

下载扩展包（不区分操作系统）

http://www.oracle.com/technetwork/cn/server-storage/virtualbox/downloads/index.html

安装基础包

按照提示安装即可

扩展包安装

1 先安装基础包

2 安装扩展包

打开虚拟机 -> 管理 -> 全局设定 -> 扩展 -> 点击右边的加号 -> 选择下载的扩展包文件，按照提示安装即可

VBox安装CentOS7

下载minimalISO

http://isoredirect.centos.org/centos/7/isos/x86_64/CentOS-7-x86_64-Minimal-1804.iso

从镜像列表里选择离自己近的镜像下载，我选择的是网易163源

虚拟机配置规划

CPU 2核，内存 1G，SWAP：2G，硬盘 40G（动态增长，非预先分配固定模式）

创建虚拟机

新建 -> 按照提示操作即可

安装CentOS7操作系统

创建包含操作系统iso文件的光盘

选中刚才创建的虚拟机 -> 设置 -> 存储 -> 点击+号，然后选择CentOS7 ISO文件

安装操作系统

启动虚拟机，会显示图形化安装界面，按照提示操作即可，会提示一系列的设置，硬盘分区我选择的自动分区。

各种设置都完成后，点击安装，等待一段时间，安装需要一些时间，我的机器上，大概等了十几分钟:)

配置虚拟机网络

最好选择NAT网络模式

安装依赖的包

因为是安装的是最小化ISO，有些基础的包都没有

yum install gcc wget lrzsz vim

问题

1 NAT网络虚拟机可以ping通主机，但主机ping不通虚拟机

采用了以下办法都不能解决(PS:以前是可以的)

1.关闭主机，虚拟机防火墙

2.重新安装VBox和虚拟机

折腾了几小时，未找到原因，先暂时使用桥接模式，后面再看看能不能想到是什么原因

Hadoop集群环境搭建

集群规划

使用3台虚拟机

1台master, ip地址:192.168.1.15

2台slave, slave1 ip地址:192.168.1.15, slave2 ip地址:192.168.1.16

实际环境中，namenode需要多分配内存，datanode需要多分配硬盘空间

master虚拟机操作

安装java

下载地址

选择安装java8

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

解压

tar -xvzf jdk-8u181-linux-x64.tar.gz

设置环境变量

export JAVA_HOME=/usr/local/src/jdk1.8.0_181

export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib

export PATH=$PATH:$JAVA_HOME/bin

环境变量生效

source ~/.bashrc

问题

x86，x64是什么意思?

x86:32位，x64:64位

2.选择tar.gz还是rpm?

这个看个人喜好吧，我选择的tar.gz，需要单独配置java相关的环境变量

hadoop 1.2.1安装

解压

[root@localhost src]# tar -xvzf hadoop-1.2.1-bin.tar.gz

创建tmp目录

[root@localhost src]# cd hadoop-1.2.1

[root@localhost hadoop-1.2.1]# mkdir tmp

配置

进入conf目录

[root@localhost hadoop-1.2.1]# cd conf

[root@localhost conf]# pwd

/usr/local/src/hadoop-1.2.1/conf

配置masters

[root@localhost conf]# vim masters

master

配置slaves

[root@localhost conf]# vim slaves

slave1

slave2

配置core-site.xml

vim core-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>

<property>

        <name>hadoop.tmp.dir</name>

        <value>/usr/local/src/hadoop-1.2.1/tmp</value>

</property>

<property>

        <name>fs.default.name</name>

        <value>hdfs://192.168.1.15:9000</value>

        </property>

</configuration>

配置mapred-site.xml

[root@localhost conf]# vim mapred-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>

        <property>

                <name>mapred.job.tracker</name>

                <value>http://192.168.1.15:9001</value>

        </property>

</configuration>

配置hdfs-site.xml

[root@localhost conf]# vim hdfs-site.xml

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>

        <property>

                <name>dfs.replication</name>

                <value>3</value>

        </property>

</configuration>

6.配置hadoop-env.sh

[root@localhost conf]# vim hadoop-env.sh

# 增加

export JAVA_HOME=/usr/local/src/jdk1.8.0_181

配置hosts

[root@localhost conf]# vim /etc/hosts

192.168.1.15 master

192.168.1.16 slave1

192.168.1.17 slave2

配置hostname

[root@localhost conf]# hostnamectl set-hostname master

[root@localhost conf]# hostnamectl status

   Static hostname: master

         Icon name: computer-vm

           Chassis: vm

        Machine ID: 8751162d551a426393cd5e5c2fadf3d3

           Boot ID: 4d3093f75e514da399ff522bea8b420f

    Virtualization: kvm

  Operating System: CentOS Linux 7 (Core)

       CPE OS Name: cpe:/o:centos:centos:7

            Kernel: Linux 3.10.0-862.el7.x86_64

      Architecture: x86-64

slave1虚拟机操作

创建

从master克隆一份（克隆之前，先退出虚拟机）

选中master虚拟机->点击鼠标右键->复制->设置虚拟名(勾选重新初始化所有网卡地址)->接下来的步骤按提示操作

设置hostname

hostnamectl set-hostname slave2

slave2虚拟机操作

操作同slave1，只不过主机名设置为slave2

虚拟机间建立互信，实现免密码登录

1.三台机分别生成rsa非对称秘钥

# master

[wadeyu@master ~]$ su root

Password:

[root@master wadeyu]# ssh-keygen

# slave1

[wadeyu@slave1 ~]$ su root

Password:

[root@slave1 wadeyu]# ssh-keygen

# slave2

[wadeyu@slave2 ~]$ su root

Password:

[root@slave2 wadeyu]# ssh-keygen

2.保存公钥到~/.ssh/authorized_keys文件中

# master机器操作

[root@master wadeyu]# cat ~/.ssh/id_rsa.pub > ~/.ssh/authorized_keys

追加slave1和slave2的公钥到这个文件中

[root@master wadeyu]# scp slave1:~/.ssh/id_rsa.pub ~/slave1_id_rsa.pub

[root@master wadeyu]# scp slave2:~/.ssh/id_rsa.pub ~/slave2_id_rsa.pub

[root@master wadeyu]# cat ~/slave1_id_rsa.pub >> ~/.ssh/authorized_keys

[root@master wadeyu]# cat ~/slave2_id_rsa.pub >> ~/.ssh/authorized_keys

复制文件~/.ssh/authorized_keys到slave1,slave2

[root@master wadeyu]# scp ~/.ssh/authorized_keys slave1:~/.ssh

root@slave1's password:

authorized_keys                                                                                              100% 1179   458.2KB/s   00:00

[root@master wadeyu]# scp ~/.ssh/authorized_keys slave2:~/.ssh

root@slave2's password:

authorized_keys

其它操作(每台虚拟机)

为了减少系统配置对集群的影响，学习环境关闭防火墙和selinux

1.关闭防火墙

[root@master wadeyu]# systemctl stop firewalld

[root@master wadeyu]# systemctl status firewalld

● firewalld.service - firewalld - dynamic firewall daemon

   Loaded: loaded (/usr/lib/systemd/system/firewalld.service; enabled; vendor preset: enabled)

   Active: inactive (dead) since Sat 2018-09-01 11:26:29 CST; 5s ago

     Docs: man:firewalld(1)

  Process: 635 ExecStart=/usr/sbin/firewalld --nofork --nopid $FIREWALLD_ARGS (code=exited, status=0/SUCCESS)

 Main PID: 635 (code=exited, status=0/SUCCESS)

Sep 01 10:23:16 master systemd[1]: Starting firewalld - dynamic firewall daemon...

Sep 01 10:23:18 master systemd[1]: Started firewalld - dynamic firewall daemon.

Sep 01 11:26:21 master systemd[1]: Stopping firewalld - dynamic firewall daemon...

Sep 01 11:26:29 master systemd[1]: Stopped firewalld - dynamic firewall daemon.

关闭selinux

[root@master wadeyu]# getenforce

Enforcing

[root@master wadeyu]# setenforce 0

[root@master wadeyu]# getenforce

Permissive

启动集群

master节点操作，进入hadoop/bin目录

第一次启动需要对hadoop格式化

[root@master wadeyu]# cd /usr/local/src/hadoop-1.2.1

hadoop-1.2.1/            hadoop-1.2.1-bin.tar.gz

[root@master wadeyu]# cd /usr/local/src/hadoop-1.2.1

[root@master hadoop-1.2.1]# cd /usr/local/src/hadoop-1.2.1/bin

[root@master bin]# ./hadoop namenode -format

18/09/01 11:37:07 INFO namenode.NameNode: STARTUP_MSG:

/************************************************************

STARTUP_MSG: Starting NameNode

STARTUP_MSG:   host = master/192.168.1.15

STARTUP_MSG:   args = [-format]

STARTUP_MSG:   version = 1.2.1

STARTUP_MSG:   build = https://svn.apache.org/repos/asf/hadoop/common/branches/branch-1.2 -r 1503152; compiled by 'mattf' on Mon Jul 22 15:23:09 PDT 2013

STARTUP_MSG:   java = 1.8.0_181

************************************************************/

18/09/01 11:37:08 INFO util.GSet: Computing capacity for map BlocksMap

18/09/01 11:37:08 INFO util.GSet: VM type       = 64-bit

18/09/01 11:37:08 INFO util.GSet: 2.0% max memory = 1013645312

18/09/01 11:37:08 INFO util.GSet: capacity      = 2^21 = 2097152 entries

18/09/01 11:37:08 INFO util.GSet: recommended=2097152, actual=2097152

18/09/01 11:37:08 INFO namenode.FSNamesystem: fsOwner=root

18/09/01 11:37:08 INFO namenode.FSNamesystem: supergroup=supergroup

18/09/01 11:37:08 INFO namenode.FSNamesystem: isPermissionEnabled=true

18/09/01 11:37:08 INFO namenode.FSNamesystem: dfs.block.invalidate.limit=100

18/09/01 11:37:08 INFO namenode.FSNamesystem: isAccessTokenEnabled=false accessKeyUpdateInterval=0 min(s), accessTokenLifetime=0 min(s)

18/09/01 11:37:08 INFO namenode.FSEditLog: dfs.namenode.edits.toleration.length = 0

18/09/01 11:37:08 INFO namenode.NameNode: Caching file names occuring more than 10 times

18/09/01 11:37:09 INFO common.Storage: Image file /usr/local/src/hadoop-1.2.1/tmp/dfs/name/current/fsimage of size 110 bytes saved in 0 seconds.

18/09/01 11:37:09 INFO namenode.FSEditLog: closing edit log: position=4, editlog=/usr/local/src/hadoop-1.2.1/tmp/dfs/name/current/edits

18/09/01 11:37:09 INFO namenode.FSEditLog: close success: truncate to 4, editlog=/usr/local/src/hadoop-1.2.1/tmp/dfs/name/current/edits

18/09/01 11:37:09 INFO common.Storage: Storage directory /usr/local/src/hadoop-1.2.1/tmp/dfs/name has been successfully formatted.

18/09/01 11:37:09 INFO namenode.NameNode: SHUTDOWN_MSG:

/************************************************************

SHUTDOWN_MSG: Shutting down NameNode at master/192.168.1.15

************************************************************/

2.启动所有节点

[root@master bin]# ./start-all.sh

starting namenode, logging to /usr/local/src/hadoop-1.2.1/libexec/../logs/hadoop-wadeyu-namenode-master.out

slave2: starting datanode, logging to /usr/local/src/hadoop-1.2.1/libexec/../logs/hadoop-root-datanode-slave2.out

slave1: starting datanode, logging to /usr/local/src/hadoop-1.2.1/libexec/../logs/hadoop-root-datanode-slave1.out

The authenticity of host 'master (192.168.1.15)' can't be established.

ECDSA key fingerprint is SHA256:8DvdHBlcz1qInlLa9k2iYyd4Ip7auPhcb0mjHbEwZmo.

ECDSA key fingerprint is MD5:9e:33:01:d2:fb:9c:dc:4f:40:30:90:fe:37:6e:1f:33.

Are you sure you want to continue connecting (yes/no)? yes

master: Warning: Permanently added 'master,192.168.1.15' (ECDSA) to the list of known hosts.

master: starting secondarynamenode, logging to /usr/local/src/hadoop-1.2.1/libexec/../logs/hadoop-root-secondarynamenode-master.out

starting jobtracker, logging to /usr/local/src/hadoop-1.2.1/libexec/../logs/hadoop-wadeyu-jobtracker-master.out

slave1: starting tasktracker, logging to /usr/local/src/hadoop-1.2.1/libexec/../logs/hadoop-root-tasktracker-slave1.out

slave2: starting tasktracker, logging to /usr/local/src/hadoop-1.2.1/libexec/../logs/hadoop-root-tasktracker-slave2.out

3.查看集群状态

# master

[root@master bin]# jps

2116 JobTracker

2232 Jps

1883 NameNode

2044 SecondaryNameNode

# slave1

[root@master bin]# ssh slave1

Last login: Sat Sep  1 11:20:05 2018 from slave2

[root@slave1 ~]# jps

3936 Jps

1617 TaskTracker

1538 DataNode

#slave2

[root@slave1 ~]# exit

logout

Connection to slave1 closed.

[root@master bin]# ssh slave2

Last login: Sat Sep  1 11:20:24 2018 from slave1

[root@slave2 ~]# jps

3774 TaskTracker

3695 DataNode

3871 Jps

4.hadoop文件操作示例

# 查看/

[root@master bin]# ./hadoop fs -ls /

Found 1 items

drwxr-xr-x   - root supergroup          0 2018-09-01 11:38 /usr

# 上传文件

[root@master bin]# ./hadoop fs -put /etc/passwd /

[root@master bin]# ./hadoop fs -ls /

Found 2 items

-rw-r--r--   3 root supergroup        847 2018-09-01 11:44 /passwd

drwxr-xr-x   - root supergroup          0 2018-09-01 11:38 /usr

# 查看文件内容

[root@master bin]# ./hadoop fs -cat /passwd

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

sync:x:5:0:sync:/sbin:/bin/sync

shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown

halt:x:7:0:halt:/sbin:/sbin/halt

mail:x:8:12:mail:/var/spool/mail:/sbin/nologin

operator:x:11:0:operator:/root:/sbin/nologin

games:x:12:100:games:/usr/games:/sbin/nologin

ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin

nobody:x:99:99:Nobody:/:/sbin/nologin

systemd-network:x:192:192:systemd Network Management:/:/sbin/nologin

dbus:x:81:81:System message bus:/:/sbin/nologin

polkitd:x:999:998:User for polkitd:/:/sbin/nologin

sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin

postfix:x:89:89::/var/spool/postfix:/sbin/nologin

wadeyu:x:1000:1000:wadeyu:/home/wadeyu:/bin/bash

说明

虚拟机使用了桥接模式连接，我在路由器增加了虚拟机mac地址和ip的绑定，所以虚拟机没有固定ip

参考资料

【0】八斗学院内部学习资料

Hadoop1.0之集群搭建的更多相关文章

Hadoop-1.0.4集群搭建笔记
这篇文章介绍的是简单的配置Hadoop集群的方法,适合实验和小型项目用,正式运行的集群需要用更正规的方法和更详细的参数配置,不适合使用这篇文章. 相关随笔: 用python + hadoop stre ...
Redis 5.0.5集群搭建
Redis 5.0.5集群搭建一.概述 Redis3.0版本之后支持Cluster. 1.1.redis cluster的现状目前redis支持的cluster特性: 1):节点自动发现 2):s ...
java_redis3.0.3集群搭建
redis3.0版本之后支持Cluster,具体介绍redis集群我就不多说,了解请看redis中文简介. 首先,直接访问redis.io官网,下载redis.tar.gz,现在版本3.0.3,我下面 ...
Redis 3.0.2集群搭建以及相关问题汇总
Redis3 正式支持了 cluster,是为了解决构建redis集群时的诸多不便 (1)像操作单个redis一样操作key,不用操心key在哪个节点上(2)在线动态添加.删除redis节点,不用停止 ...
Hadoop2.0 HA集群搭建步骤
上一次搭建的Hadoop是一个伪分布式的,这次我们做一个用于个人的Hadoop集群(希望对大家搭建集群有所帮助): 集群节点分配: Park01 Zookeeper NameNode (active) ...
CDH 6.0.1 集群搭建「After install」
集群搭建完成之后其实还有很多配置工作要做,这里我列举一些我去做的一些. 首先是去把 zk 的角色重新分配一下,不知道是不是我在配置的时候遗漏了什么在启动之后就有报警说目前只能检查到一个节点.去将 zk ...
CDH 6.0.1 集群搭建「Before install」
从这一篇文章开始会有三篇文章依次介绍集群搭建「Before install」「Process」「After install」继上一篇使用 docker 部署单机 CDH 的文章,当我们使用 d ...
redis4.0.6集群搭建
文件环境:CentOS7 + redis4.0.6 先去官网下载redis:https://redis.io/,然后上传到你的虚拟机,我上传到了/mysoft 先解压->然后进入主目录-> ...
redis3.0.3集群搭建
redis3.0版本之后支持Cluster,具体介绍redis集群我就不多说,了解请看redis中文简介. 首先,直接访问redis.io官网,下载redis.tar.gz,现在版本3.0.3,我下面 ...

随机推荐

9.11NOIP模拟题
NOIP模拟赛 by thmyl 题目名称 superman market Lemon_Soda 可执行文件名 superman market Lemon_Soda 输入文件 superman.i ...
unittest举例
步骤:1.先导入unittest2.编写一个测试类(继承unittest.TestCase)3.编写测试用例类,一个方法就是一条用例4.加载测试用例,有三种方式:加载测试方法,加载测试类,加载测试模块 ...
HyperLedger Fabric部署与链码解读
1.Fabric简介 Fabric是超级账本中的一个项目,用以推进区块链技术.和其他区块链类似,它也有一个账本,使用智能合约,且是一个参与者可以分别管理自身交易的系统.它是一个联盟链.Fabric与其 ...
$P2126 Mzc家中的男家丁$
problem #ifdef Dubug #endif #include <bits/stdc++.h> using namespace std; typedef long long LL ...
CTSC+APIO+THUACM游记
退役之前,写点破事乐呵乐呵.. (同DaD3zZ) CTSC Day0 来到丽都哈哈哈这可是四星级豪华酒店啊想想要在这住7天美滋滋换了半天的房间也没有换到一起最后yzy& ...
scrapy 框架持久化存储
1.基于终端的持久化存储保证爬虫文件的parse方法中有可迭代类型对象(通常为列表或字典)的返回,该返回值可以通过终端指令的形式写入指定格式的文件中进行持久化操作. # 执行输出指定格式进行存储:将 ...
10 在C#中读取文件
我们在前一个练习中已经了解了如何在C#控制台程序(console)中读取用户的输入.现在我们要学习如何从一个文件中读取内容.在下面的练习中,你要格外小心.关于文件的操作,一不小心会损失你的重要文件. ...
VS2015环境配置： VS2015 未能正确加载“ResourceManagerPackage”包的问题
启动vs2015专业版时,出现类似于这样的提示框,有好几个,点击是或否,但下次打开还是会出现.笔者也寻找了网上的一些解决办法,例如用vs命令窗口或其他,但都无疾而终,下面提供的这个办法,顺利解决此问题 ...
关于MVC视图下拉菜单绑定与取值的问题
绑定视图中dropdownlist: 视图中的代码: @Html.DropDownList("select1") 此处的slect1也就是页面上的<select>< ...
Java 中父类变量访问子类方法需要使用类型转换（instenceof）关键字 /类型判断/
通过数组元素访问方法的时候只能访问在 Animal中定义的方法,对于 Tiger类和 Fish中定义的方法时却不能调用,例如语句 animal[2].swim();就是不正确的.当需要访问这些 ...

Hadoop1.0之集群搭建

VirtualBox虚拟机

下载地址

安装基础包

扩展包安装

VBox安装CentOS7

下载minimalISO

虚拟机配置规划

创建虚拟机

安装CentOS7操作系统

创建包含操作系统iso文件的光盘

安装操作系统

配置虚拟机网络

安装依赖的包

问题

Hadoop集群环境搭建

集群规划

master虚拟机操作

安装java

下载地址

解压

设置环境变量

环境变量生效

问题

hadoop 1.2.1安装

解压

创建tmp目录

配置

slave1虚拟机操作

创建

设置hostname

slave2虚拟机操作

虚拟机间建立互信，实现免密码登录

其它操作(每台虚拟机)

启动集群

说明

参考资料

Hadoop1.0之集群搭建的更多相关文章

随机推荐

热门专题