Hadoop-hdfs安装与配置
一、安装要求
安装JDK
yum -y install jdk(或手动安装)
设置namenode节点到datanode节点的免密码登陆
a. 本地免密码登录
# ssh localhost #检测能否在本机上实现免密码登陆
# ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa #创建登陆的公钥和私钥,公钥放在id_dsa.pub中,私钥放在id_dsa中
# cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys #将公钥追加到已认证信息中
# ssh localhost #实现免密码登陆
b. 跨主机免密码登陆
# scp ~/.ssh/id_dsa.pub root@node2:~/.ssh/ #在namenode上执行
# cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys #将公钥追加到已认证信息中,在datanode上执行该操作
c. 对所有的datanode执行上述操作
设置域名解析(在所有的节点增加)
# vi /etc/hosts # 增加节点对应节点,如果不加入节点则在配置文件中需要直接写节点的IP
192.168.150.128 node1
192.168.150.129 node2
192.168.150.130 node3
192.168.150.131 node4
二、安装
由于hadoop有bin包,所以hadoop下载后只需要解压即可使用。
版本hadoop-1.2.1
namenode和datanode上软件包的放置位置要完全相同,否则在集群启动服务的时候会出现找不到文件的情况。
在软件解压到/root/hadoop-1.2.1文件夹
三、配置
核心模块的配置
#vi /root/hadoop-1.2.1/conf/core-site.xml
<configuration>
<property>
<name>fs.default.name</name> # namenode节点名
<value>hdfs://node1:9000</value> #namenode域名(或IP)和端口
</property>
<property>
<name>hadoop.tmp.dir</name> #文件储存目录
<value>/opt/hadoop-1.2</value> #fs的放置位置
</property>
</configuration>
其它具体配置可以查看./hadoop-1.2.1/docs的文档。
#vi /root/hadoop-1.2.1/conf/hdfs-site.xml
<configuration>
<name>dfs.replication</name> #block的副本数,不能超过datanode的数目
<value>2</value>
</configuration>
#vi /root/hadoop-1.2.1/conf/slaves #该文件设置datanode节点的域名(IP)
node2
node3
#vi /root/hadoop-1.2.1/conf/masters #该文件设置secondarynamenode节点的域名(IP)
node2 # 只要跟namenode不在同一台机器上即可
#vi /root/hadoop-1.2.1/conf/hadoop-env.sh #设置运行环境
export JAVA_HOME=/usr/java/jdk1.7.0_79 # 只要设置jdk的目录即可
在所有的节点上进行上述的相同配置。
四、测试
# /root/hadoop-1.2.1/bin/hadoop namenode -format #进行格式化,创建dfs
# /root/hadoop-1.2.1/bin/start-dfs.sh #启动dfs服务
# jps #查看启动的java进程(namenode上)
# jps #查看启动的java进程(datanode上)
在浏览器上输入namenode的IP和端口,即可进入文件系统
http://192.168.150.128:50070
注意:如果要进入子目录,那么要在windows上hosts文件也设置同样的域名解析,否则浏览器会提示错误,因为没有对应的ip时浏览器会访问外网。
文件传输和执行java程序
# /root/hadoop-1.2.1/bin/hadoop -fs -put file input #将file文件传输到文件系统的root用户下的input目录
# /root/hadoop-1.2.1/bin/hadoop jar hadoop-examples-*.jar grep input output 'dfs[a-z.]+' # 执行jar程序
# /root/hadoop-1.2.1/bin/hadoop fs -get output output 获取并在本地文件系统中显示数据
# cat output/*
或 #/root/hadoop-1.2.1/bin/hadoop fs -cat output/*
关闭进程
# /root/hadoop-1.2.1/bin/stop-dfs.sh
五、总结
虽然说hdfs是文件系统,但本质上并没有格式化本机上的硬盘,所以其实只是硬盘上的一种特殊的文件储存格式,并且必须通过IP:PORT进行访问。实质上在配置并启动了集群之后,集群之间便会进行网络通信,并通过namenode的IP和指定端口(50070)对外提供访问。
Hadoop-hdfs安装与配置的更多相关文章
- ubuntu在虚拟机下的安装 ~~~ Hadoop的安装及配置 ~~~ Hdfs中eclipse的安装
前言 Hadoop是基于Java语言开发的,具有很好跨平台的特性.Hadoop的所要求系统环境适用于Windows,Linux,Mac系统,我们推荐选择使用Linux或Mac系统.而Linux系统则 ...
- hadoop的安装和配置(三)完全分布式模式
博主会用三篇文章为大家详细说明hadoop的三种模式: 本地模式 伪分布模式 完全分布模式 完全分布式模式: 前面已经说了本地模式和伪分布模式,这两种在hadoop的应用中并不用于实际,因为几乎没人会 ...
- hadoop的安装和配置(二)伪分布模式
博主会用三篇文章为大家详细的说明hadoop的三种模式: 本地模式 伪分布模式 完全分布模式 伪分布式模式: 这篇为大家带来hadoop的伪分布模式: 从最简单的方面来说,伪分布模式就是在本地模式上修 ...
- Ubuntu下伪分布式模式Hadoop的安装及配置
1.Hadoop运行模式Hadoop有三种运行模式,分别如下:单机(非分布式)模式伪分布式(用不同进程模仿分布式运行中的各类节点)模式完全分布式模式注:前两种可以在单机运行,最后一种用于真实的集群环境 ...
- Linux中Hadoop的安装与配置
一.准备 1,配通网络 ping www.baidu.com 之前安装虚拟机时配过 2,关闭防火墙 systemctl stop firewalld systemctl disable firewal ...
- Hadoop(2)-CentOS下的jdk和hadoop的安装与配置
准备工作 下载jdk8和hadoop2.7.2 使用sftp的方式传到hadoop100上的/opt/software目录中 配置环境 如果安装虚拟机时选择了open java,请先卸载 rpm -q ...
- 从零开始搭建系统2.8——HDFS安装及配置
从零开始搭建系统2.8——HDFS安装及配置
- Hadoop HDFS安装、环境配置
hadoop安装 进入Xftp将hadoop-2.7.3.tar.gz 复制到自己的虚拟机系统下的放软件的地方,我的是/soft/software 在虚拟机系统装软件文件里,进行解压缩并重命名 进入p ...
- Hadoop 的安装及配置
Linux RedHat--CentOs CentOs 6.4 Debian--Ubuntu VMware 虚拟机 关于虚拟机实现上网的解决办法 NAT: 网络地址转换 当 ...
- Ubuntu16.04 下 hadoop的安装与配置(伪分布式环境)
一.准备 1.1创建hadoop用户 $ sudo useradd -m hadoop -s /bin/bash #创建hadoop用户,并使用/bin/bash作为shell $ sudo pass ...
随机推荐
- [BZOJ2331]地板(插头DP)
Description lxhgww的小名叫"小L",这是因为他总是很喜欢L型的东西.小L家的客厅是一个的矩形,现在他想用L型的地板来铺满整个客厅,客厅里有些位置有柱子,不能铺地板 ...
- V4L2学习(四)VIVI分析
vivi 相对于后面要分析的 usb 摄像头驱动程序,它没有真正的硬件相关层的操作,也就是说抛开了复杂的 usb 层的相关知识,便于理解 V4L2 驱动框架,侧重于驱动和应用的交互. 前面我们提到,V ...
- 扩展程序 - Google Chrome
Adblock Plus 3.0.3 Adblock Plus 已被超过 1 亿台设备使用,是世界上最受欢迎的广告拦截软件. ID:cfhdojbkjhnklbpkdaibdccddilifddb 查 ...
- 4819: [Sdoi2017]新生舞会(分数规划)
4819: [Sdoi2017]新生舞会 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 1031 Solved: 530[Submit][Statu ...
- 使用html进行浏览器判断,浏览器条件注释
下面来点今天写东西的时候查资料,收集的关于使用html进行浏览器判断的一些资料: 条件注释的基本格式: <!--[if expression]>注释内容<![endif]--> ...
- C++ map 的用法归纳2
[尊重原著: http://blog.csdn.net/zcf1002797280/article/details/7847819] Map是c++的一个标准容器,它提供了很好一对一的关系,在一些程序 ...
- Jmeter-深入理解cookie,session,token
1.很久很久以前,Web 基本上就是文档的浏览而已, 既然是浏览,作为服务器, 不需要记录谁在某一段时间里都浏览了什么文档,每次请求都是一个新的HTTP协议, 就是请求加响应, 尤其是我不用记住是谁 ...
- Python 连接数据库失败
什么是 PyMySQL? PyMySQL 是在 Python3.x 版本中用于连接 MySQL 服务器的一个库,Python2中则使用mysqldb. PyMySQL 遵循 Python 数据库 AP ...
- git和github基础入门
一.git: 1.安装配置git: 1.1从官网或者该网址处下载:https://pan.baidu.com/s/1kU5OCOB#list/path=%2Fpub%2Fgit 1.2安装,一路nex ...
- 系统中同时安装sql2005 和 sql2008 R2 提示要删除SQL Server 2005 Express
修改注册表:HKLM\Software\Microsoft\Microsoft SQL Server\90\Tools\ShellSEM,把 ShellSEM重命名即可 如果是64位机器 在 HKL ...