大数据 --> Hadoop集群搭建
Hadoop集群搭建
1.修改/etc/hosts文件
在每台linux机器上,sudo vim /etc/hosts 编写hosts文件。将主机名和ip地址的映射填写进去。编辑完后,结果如下:
2.配置ssh,实现无密码登录
四台虚拟机上,使用: ssh-keygen -t rsa 一路回车就行了
master上将公钥放到authorized_keys里。命令::
sudo cat id_rsa.pub >> authorized_keys
将master上的authorized_keys放到其他linux的~/.ssh目录下。
sudo scp authorized_keys cjpt@132.228.28.183:~/.ssh
修改authorized_keys权限,命令:chmod 644 authorized_keys
测试是否成功
ssh cjpt@132.228.28.183
输入用户名密码,然后退出,再次ssh hostbb不用密码,直接进入系统。这就表示成功了
3.上传jdk,并配置环境变量
下载java,解压缩放到/usr/lib/jvm路径下
在.bash_profile文件添加环境变量,vim ~/.bash_profile:
export JAVA_HOME=/usr/lib/jvm/jdk1..0_60
export JRE_HOME=/usr/lib/jvm/jdk1..0_60/jre
source ~/.bash_profile,使配置生效
4.上传hadoop,并配置hadoop
4.1. 下载hadoop包,解压缩到本地路径
4.2. 修改环境变量,将hadoop加进去
vim ~/.bashrc
export HADOOP_PREFIX=/home/cjpt/hadoop-2.2.0.2.0.6.-
export HADOOP_HOME=/home/cjpt/hadoop-2.2.0.2.0.6.-
export PATH=$HADOOP_HOME/bin:$JAVA_HOME/bin:$JRE_HOME/bin:$PATH
4.3. 修改hadoop/etc/hadoop/下面的配置文件
- hadoop-env.sh
注意:JAVA_HOME必须是绝对路径,不然会报错
- core-site.xml
- hdfs-site.xml,
- mapred-site.xml,
- master,
- slave,
上面的hadoop-env.sh,core-site.xml,mapred-site.xml,hdfs-site.xml,master,slave几个文件,在四台linux中都是一样的。
配置完一台电脑后,可以将hadoop包,直接拷贝到其他电脑上。
4.4. 让hadoop配置生效
source hadoop-env.sh
4.5. 格式化namenode,只格式一次
hadoop namenode –format
4.6. 启动hadoop
切到hadoop/sbin目录下,执行 start-all.sh启动所有程序
./start-all.sh
4.7. 查看进程,是否启动
jps
- master主机:
- slave机器:
大数据 --> Hadoop集群搭建的更多相关文章
- 大数据-HDFS 集群搭建的配置文件
1.HDFS简单版集群搭建相关配置文件 1.core-site.xml文件 <property> <name>fs.defaultFS</name> <val ...
- 大数据 -- Hadoop集群环境搭建
首先我们来认识一下HDFS, HDFS(Hadoop Distributed File System )Hadoop分布式文件系统.它其实是将一个大文件分成若干块保存在不同服务器的多个节点中.通过联网 ...
- [转]大数据hadoop集群硬件选择
问题导读 1.哪些情况会遇到io受限制? 2.哪些情况会遇到cpu受限制? 3.如何选择机器配置类型? 4.为数据节点/任务追踪器提供的推荐哪些规格? 随着Apache Hadoop的起步,云客户 ...
- 大数据——Hadoop集群坏境CentOS安装
前言 前面我们主要分析了搭建Hadoop集群所需要准备的内容和一些提前规划好的项,本篇我们主要来分析如何安装CentOS操作系统,以及一些基础的设置,闲言少叙,我们进入本篇的正题. 技术准备 VMwa ...
- 大数据 --> Kafka集群搭建
Kafka集群搭建 下面是以三台机器搭建为例,(扩展到4台以上一样,修改下配置文件即可) 1.下载kafka http://apache.fayea.com/kafka/0.9.0.1/ ,拷贝到三台 ...
- 王雅超的学习笔记-大数据hadoop集群部署(十)
Spark集群安装部署
- 大数据hadoop集群部署(一)
环境系统配置 JAVA虚拟机的安装
- 王雅超的学习笔记-大数据hadoop集群部署(七)
MySQL的安装部署
- 大数据初级笔记二:Hadoop入门之Hadoop集群搭建
Hadoop集群搭建 把环境全部准备好,包括编程环境. JDK安装 版本要求: 强烈建议使用64位的JDK版本,这样的优势在于JVM的能够访问到的最大内存就不受限制,基于后期可能会学习到Spark技术 ...
随机推荐
- SetCooperativeLevel函数介绍(设置协作等级)
函数声明 function SetCooperativeLevel(hWnd: HWND; dwFlags: DWORD): HResult; stdcall; 参数介绍 hWnd Di ...
- [linux]device eth0 does not seem to be present, delaying initialization
mlite虚拟机启动出错,就把这个虚拟机删除掉重新建立,系统虚拟硬盘使用之前的,启动系统后不能上网,通过ifconfig查看网卡没启动,遂启动网卡服务,但是出错,就是:device eth0 does ...
- code is 9998;desc is 插入失败exception is org.hibernate.exception.JDBCConnectionException: Could not op
1.错误描述 [ERROR:]2015-05-05 09:27:12,090 [插入失败] org.hibernate.exception.JDBCConnectionException: Could ...
- 事件绑定与解除js
//Ys为元素,Sj为事件,Hs为函数,bol选择是true绑定事件,还是false解除事件 //需要提前定义a,b,c,bol function thing(Ys,Sj,Hs,bol){ var i ...
- Eclipse去除网上复制下来的来代码带有的行号
一.正则表达式去除代码行号 作为开发人员,我们经常从网上复制一些代码,有些时候复制的代码前面是带有行号,如: MyEclipse本身自带有查找替换功能,并且支持正则表达式替换,使用正则替换就可以很容易 ...
- MySQL入门笔记(二)
MySQL的数据类型.数据库操作.针对单表的操作以及简单的记录操作可参考:MySQL入门笔记(一) 五.子查询 子查询可简单地理解为查询中的查询,即子查询外部必然还有一层查询,并且这里的查询并非仅 ...
- Bzoj2946:[POI2000] 最长公共子串
题面 求多个串的最长公共子串 Sol 套路,拼在一起,二分答案+后缀数组判定 把大于答案的\(height\)分组,然后计算出一个组内是否有所有串的后缀 由于串只有\(5\)个开个桶就好了 # inc ...
- css实现按钮点击效果(超简单)
在html中设置class: <button class="button1">click</button> css中如下所示: .button1{ p ...
- Delphi关于TAdvStringGrid控件颜色的设置
FixedFont-Color 标题行和列字体的颜色 Font-color 单元格字体的颜色Visual-color 整个表格的背景色填充
- 空间金字塔池化(Spatial Pyramid Pooling, SPP)原理和代码实现(Pytorch)
想直接看公式的可跳至第三节 3.公式修正 一.为什么需要SPP 首先需要知道为什么会需要SPP. 我们都知道卷积神经网络(CNN)由卷积层和全连接层组成,其中卷积层对于输入数据的大小并没有要求,唯一对 ...