搭建Hadoop集群 (一)
上面讲了如何搭建Hadoop的Standalone和Pseudo-Distributed Mode(搭建单节点Hadoop应用环境), 现在我们来搭建一个Fully-Distributed Mode的Hadoop Cluster.
环境
虚拟机: VirtualBox 5
Server操作系统: CentOS-6.7-x86_64-LiveCD
Hadoop版本: 2.6.2
安装Linux虚拟机
安装虚拟机, 这里一共安装3台, hostname分别取名: master, slave1, slave2. 虚拟机网络采用Bridged Adapter.
master扮演NameNode和ResourceManager的角色. 如果你的硬件条件允许, 也可以单独为ResourceManager使用一台虚拟机, 组成masters虚拟机群.
slave则被用作DataNode和NodeManager.
创建hadoop专用账户
按照正常步骤安装系统, LiveCD版本可以在安装过程中, 直接创建新用户, 用户名设为hm, 作为hadoop的专用账户.
或者使用命令行新建hadoop用户和组, 并设置密码:
[root@localhost /]# groupadd hadoop
[root@localhost /]# useradd -s /bin/bash -d /home/hm -m hm -g hadoop
[root@localhost /]# passwd hm
为hm添加sudoer权限
[root@localhost /]# chmod u+w /etc/sudoers
[root@localhost /]# vi /etc/sudoers
[root@localhost /]# chmod u-w /etc/sudoers
在sudoers中修改:
## Allow root to run any commands anywhere
root ALL=(ALL) ALL
hm ALL=(ALL) ALL :x 保存退出
[root@localhost /]# chmod u-w /etc/sudoers
[root@localhost /]# reboot
修改HostName
以master机器为例:
[hm@localhost ~]$ sudo vi /etc/hosts
为你的hostname映射正确的ip (ip根据你的ifconfig结果来定)
192.168.1.105 master
192.168.1.106 slave1
192.168.1.107 slave2
再把network中的hostname改成master
[hm@master ~]$ sudo vi /etc/sysconfig/network
重启生效.
安装VirtualBox Guest Additions增强包(Optional - 推荐)
方便后续操作. (主机-虚机之间文件拖拽, 鼠标集成, 共享剪贴板等等)
首先确认Internet访问正常
如果你的网络有防火墙, 去左上角菜单中, System->Preferences->Network Proxy中设置.
同时, 把master, slave1, slave2加入到proxy的Ignored Hosts里面.
最后, 修改yum配置使得它能从网上下载安装包和相关依赖.
打开Terminal:
[hm@master ~]# sudo vi /etc/yum.conf
添加: (无需用户名密码的话, 最后两行省略)
# The proxy server - proxy server:port number
proxy=http://yourproxy.yourdomain.com:yourport
# The account details for yum connections
proxy_username=yourusername
proxy_password=yourpassword
安装VirtualBox增强包
点击Devices->Insert Guest Additions CD Image.. 双击光盘运行安装.
如果遇到安装Failed:
安装kernel-devel package(安装增强包需要用到它): 该package包含内核开发环境所需的内核头文件, 以及编译它们所需的Makefile. (CentOS6.7 LiveCD版, 以及某些RH发行版, 默认无附带)
[hm@master ~]# sudo yum install kernel-devel-2.6.32-573.el6.x86_64 gcc
再次尝试安装增强包, 应该就能成功. (如果提示OpenGL Support Module Failed, 可忽略)
点击Devices->Shared ClipBoard和Drag and Drop, 设置成Bidirectional.
重启虚拟机. 则可以和主机共享剪贴板, 并且可以相互拖拽文件.
安装配置SSH和JAVA
安装软件包
首先确认是否已经有安装: (其中openssh-server只要确保master上有即可)
[hm@master ~]$ rpm -qa | grep ssh
[hm@master ~]$ rpm -qa | grep jdk
可以看到openssh的server和client都已经安装, 因此只需要安装jdk即可. (hadoop查看守护进程需要用到jdk里的jps命令, 需要openjdk的devel版本, 或者sun jdk)
[hm@master ~]$ yum search openjdk
[hm@master ~]$ sudo yum install java-1.7.0-openjdk-devel.x86_64
查看一下安装目录, 记下来将来配置hdfs要用.
[hm@master ~]$ rpm -ql java-1.7.0-openjdk-devel-1.7.0.95-2.6.4.0.el6_7.x86_64
得到jdk的绝对安装路径: /usr/lib/jvm/java-1.7.0-openjdk-1.7.0.95.x86_64
Optional - 克隆创建slave1和slave2
先Power Off master虚拟机, 右键点选它, clone.
由于我们要让三台虚拟机在同一个网段运行, 推荐勾选Reinitialize the MAC address of all network cards. 如果不幸遇到网卡找不到或者不匹配, 需自己手动修改/etc/sysconfig/network-scripts/ifcfg-eth*. 具体自行谷歌.
Full Clone, 成功后启动slave虚拟机.
修改hosts和network两个文件, 参考上文.
这时输入ping master, ping slave1之类的命令, 应该相互可以通讯. (别忘记将slave的信息放入master的hosts文件中)
192.168.1.105 master
192.168.1.106 slave1
192.168.1.107 slave2
在master上启动SSH Server
检查ssh server的进程是否启动
[hm@master ~]$ ps -e|grep sshd
如果没有, 手动启动该进程
[hm@master ~]$ sudo /etc/init.d/sshd start
Optional - 设置sshd开机启动
先检查当前设置
[hm@master ~]$ chkconfig --list sshd
sshd 0:off 1:off 2:off 3:off 4:off 5:off 6:off
设成开机启动
[hm@master ~]$ sudo chkconfig sshd on
再次检查可以看到2-5项都变成on了.
设置master和slave1, slave2之间免密码SSH登录
单机免密码登录
主要目的是看看ssh是否正常工作
[hm@master ~]$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
[hm@master ~]$ cat .ssh/id_dsa.pub >> .ssh/authorized_keys
[hm@master ~]$ ssh localhost
成功登录后, 输入exit退出当前ssh登录. 以后再输入ssh localhost就可以直接无密码登录. 如果再次登录还需要密码, 尝试把authorized_keys权限改为600.
master免密码SSH登录slave
登录slave1, 把master的公钥拷贝到slave的authorized_keys中.
[hm@slave1 ~]$ scp hm@master:~/.ssh/id_dsa.pub .ssh/master_dsa.pub
[hm@slave1 ~]$ cat .ssh/master_dsa.pub >> .ssh/authorized_keys
用hm账户登录master, 输入ssh slave1, 首次连接后, 之后即可无密码访问slave1. 同理为slave2配置免密码访问.
到此, master-slave结构的虚拟机集群搭建完毕, 接下来开始安装Hadoop, 参见 搭建Hadoop集群 (二)
搭建Hadoop集群 (一)的更多相关文章
- 使用Windows Azure的VM安装和配置CDH搭建Hadoop集群
本文主要内容是使用Windows Azure的VIRTUAL MACHINES和NETWORKS服务安装CDH (Cloudera Distribution Including Apache Hado ...
- virtualbox 虚拟3台虚拟机搭建hadoop集群
用了这么久的hadoop,只会使用streaming接口跑任务,各种调优还不熟练,自定义inputformat , outputformat, partitioner 还不会写,于是干脆从头开始,自己 ...
- 搭建Hadoop集群 (三)
通过 搭建Hadoop集群 (二), 我们已经可以顺利运行自带的wordcount程序. 下面学习如何创建自己的Java应用, 放到Hadoop集群上运行, 并且可以通过debug来调试. 有多少种D ...
- 搭建Hadoop集群 (二)
前面的步骤请看 搭建Hadoop集群 (一) 安装Hadoop 解压安装 登录master, 下载解压hadoop 2.6.2压缩包到/home/hm/文件夹. (也可以从主机拖拽或者psftp压缩 ...
- Linux下搭建Hadoop集群
本文地址: 1.前言 本文描述的是如何使用3台Hadoop节点搭建一个集群.本文中,使用的是三个Ubuntu虚拟机,并没有使用三台物理机.在使用物理机搭建Hadoop集群的时候,也可以参考本文.首先这 ...
- Hadoop入门进阶步步高(五)-搭建Hadoop集群
五.搭建Hadoop集群 上面的步骤,确认了单机能够运行Hadoop的伪分布运行,真正的分布式运行无非也就是多几台slave机器而已,配置方面的有一点点差别,配置起来就很easy了. 1.准备三台se ...
- Linux 搭建Hadoop集群 成功
内容基于(自己的真是操作步骤编写) Linux 搭建Hadoop集群---Jdk配置 Linux 搭建Hadoop集群 ---SSH免密登陆 一:下载安装 Hadoop 1.1:下载指定的Hadoop ...
- 阿里云搭建hadoop集群服务器,内网、外网访问问题(详解。。。)
这个问题花费了我将近两天的时间,经过多次试错和尝试,现在想分享给大家来解决此问题避免大家入坑,以前都是在局域网上搭建的hadoop集群,并且是局域网访问的,没遇见此问题. 因为阿里云上搭建的hadoo ...
- 虚拟机搭建Hadoop集群
安装包准备 操作系统:ubuntu-16.04.3-desktop-amd64.iso 软件包:VirtualBox 安装包:hadoop-3.0.0.tar.gz,jdk-8u161-linux-x ...
随机推荐
- 消除“Permission is only granted to system apps”错误
遇见这个问题我百度搜了一大堆说是须要clean项目,可是我每次clean项目的时候我的R文件总是丢失. 如今我给大家介绍一下避免授予系统权限报错更改方法 在AndroidManifest.xml中使用 ...
- Lua中强大的元方法__index详解
今天要来介绍比较好玩的内容:__index元方法 我是备胎,记得回头看看 咳咳,相信每一位女生都拥有或者不知不觉中拥有了一些备胎,啊!当然,又或许是成为过别人的备胎. 没有备胎的人,就不是完整的人生. ...
- (跨平台)cocos2d-x C++ or Object-C(前端)调用C# webservices(后台),实现交叉编译到Android/IOS/WinPhone等移动终端设备
1.2014年4月2号算是正式找到自己的实习工作-杭州美迪软件有限公司(移动物联事业部)合作于:四川管家婆总部移动终端代理,由于在校选编程专业语言C#和在浙大网新培训课程(C#.Asp.net开发)缘 ...
- [转载]PDO防注入原理分析以及使用PDO的注意事项
本文全部内容转载自月影无痕的博客http://zhangxugg-163-com.iteye.com/blog/1835721#bc2346092,感谢作者的分享 合理正确使用PDO,可以基本上防止S ...
- Linux下为何都是文件的理解
所谓“文件”,就是在我们的电脑中,以实现某种功能.或某个软件的部分功能为目的而定义的一个单位. Linux都是以文件的形式存在,当我们访问某个文件(Linux中的文件有目录,连接,普通文本),由于Li ...
- JavaScript装逼指南
如何写JavaScript才能逼格更高呢?怎样才能组织JavaScript才能让别人一眼看出你不简单呢?是否很期待别人在看完你的代码之后感叹一句“原来还可以这样写”呢?下面列出一些在JavaScrip ...
- OSC本地库推送到远程库
1.新建远程库: 例如:http://git.oschina.net/intval/learngit 2.本地生成ssh密钥 ssh-keygen -t rsa -C "intval@163 ...
- HTTP协议中keep-alive
一 . http协议是有连接的协议,这样每一个连接过来都要重新打开一个tcp的http socket,短期内同一个host 对服务器的请求就会很慢,若是能够保持住连接,就可以节省socket open ...
- jmake 编译当前目录所有c/c++单文件
在一个目录下写一些单文件的c或者c++文件时,每次敲出命令如g++ a.cpp -o a感觉比较麻烦. 所以就模仿makefile的功能,实现了扫描当前目录,并将所有c文件.cc文件.cpp文件直接调 ...
- 【POJ】2492 A bug's life ——种类并查集
A Bug's Life Time Limit: 10000MS Memory Limit: 65536K Total Submissions: 28211 Accepted: 9177 De ...