Ubuntu下 hadoop2.5.1 (伪分布模式) 配置工作
一:安装JDK
hadoop 是以java语言写的,因此需要在本地计算机上预先安装JDK,安装JDK的方法这里不再详述。
二:创建hadoop用户
为hadoop创建一个专门的用户,将所有的hadoop的工作放到这个用户下。
$sudo adduser hadoop
回车后会提示输入新建用户hadoop的密码,输入密码后会有一些选项确认:
Changing the user information for username
Enter the new value, or press ENTER for the default
Full Name []:
Room Number []:
Work Phone []:
Home Phone []:
Other []:
这个信息是否正确? [Y/n]
回车保持默认即可。
三:下载hadoop
从apache hadoop 上下载稳定版本的发布包,这里采用的是hadoop-2.5.1. 下载地址:http://hadoop.apache.org/releases.html
配置~/.bashrc(待细究)
$ sudo gedit ~/.bashrc
将如下jdk的信息内容加到后面:
export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_67
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
四:安装配置ssh
1.安装ssh
$sudo apt-get install ssh openssh-server
2.ssh无密码验证登录
1)生成当前用户的SSH公钥
$ssh-keygen -t rsa -P ""
2)将~/.ssh/id_rsa.pub添加到目标机器的~/.ssh/authorized_keys文件中
$cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
3)使用
$ssh localhost
命令即可免密码登录到本地。
五:解压hadoop源码包
终端下利用cd命令进入到到步骤三下载的hadoop源码包所在目录,使用复制命令把hadoop源码包复制到/home/hadoop下
$cp hadoop-2.5.1.tar.gz /home/hadoop
在/home/hadoop下将hadoop-2.5.1.tar.gz解压到当前文件夹
$tar -xzvf hadoop-2.5.1.tar.gz
六:配置hadoop的hadoop-2.5.1/etc/hadoop下的hadoop-env.sh,core-site.xml,mapred-site.xml,hdfs-site.xml
1.配置hadoop-env.sh,命令行:
$gedit /home/hadoop/hadoop-2.5.1/etc/hadoop/hadoop-env.sh
将下面原来的:
# The java implementation to use.
export JAVA_HOME=${JAVA_HOME}
将${JAVA_HOME}改为自己的jdk路径,例如我的如下:
# The java implementation to use.
export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_67
2.配置core-site.xml
$gedit /home/hadoop/hadoop-2.5.1/etc/hadoop/core-site.xml
在/home/hadoop/hadoop-2.5.1/下新建hadoop_tmp目录,将core-site.xml ,在<configuration></configuration>之间添加信息
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop/hadoop-2.5.1/hadoop_tmp</value>
<description>A base for other temporary directories.</description>
</property> </configuration>
3.配置mapred-site.xml
在<configuration></configuration>之间添加如下信息
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
4.配置hdfs-site.xml
hdfs-site.xml用来配置集群中每台主机都可用,指定主机上作为namenode和datanode的目录。
在/home/hadoop/hadoop-2.5.1下创建文件夹hdfs:
$cd /home/hadoop/hadoop-2.5.1
进入后:
$mkdir hdfs
$mkdir hdfs/name
$mkdir hdfs/data
用gedit命令hdfs-site.xml如下:
$gedit /home/hadoop/hadoop-2.5.1/etc/hadoop/hdfs-site.xml
在该文件的<configuration></configuration>之间增加如下内容:
<configuration>
<property> <name>dfs.namenode.name.dir</name> <value>file:/home/hadoop/hadoop-2.5.1/hdfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/home/hadoop/hadoop-2.5.1/hdfs/data</value> </property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
保存、关闭编辑窗口
七:格式化hdfs:
cd进入hadoop-2.5.1后:
$ bin/hadoop namenode -format
八:启动hadoop
cd进入hadoop-2.5.1目录后:
$sbin/start-dfs.sh
执行 jps命令,会看到Hadoop相关的进程:
$jps
会有如下信息:
hadoop@tiffer-Aspire-V3-571G:~/hadoop-2.5.1$ jps
11409 NameNode
11760 SecondaryNameNode
11874 Jps
11569 DataNode
浏览器打开 http://localhost:50070/,会看到hdfs管理页面。
若果想关闭hadoop可以使用:
$sbin/stop-all.sh
至此,hadoop伪分布的搭建基本完成。
各种问题总结:
(1)ssh免密码登陆配置之后失败原因之一:
.ssh及其下属子文件的权限问题:
1.首先.ssh的父目录文件权限应该是755,即所属用户的 用户文件 (/home下属的一个用户文件)。
2然后.ssh目录权限是700, 两个dsa 和 rsa的 私钥权限是600,其余文件权限是644.
Ubuntu下 hadoop2.5.1 (伪分布模式) 配置工作的更多相关文章
- 3-2 Hadoop集群伪分布模式配置部署
Hadoop伪分布模式配置部署 一.实验介绍 1.1 实验内容 hadoop配置文件介绍及修改 hdfs格式化 启动hadoop进程,验证安装 1.2 实验知识点 hadoop核心配置文件 文件系统的 ...
- hadoop2.4.1伪分布模式部署
hadoop2.4.1伪分布模式部署 (承接上一篇hadoop2.4.1-src的编译安装继续配置:http://www.cnblogs.com/wrencai/p/3897438.html) 感谢: ...
- hadoop2.2.0伪分布模式64位安装
hadoop2.2.0伪分布模式64位安装用到的软件:jdk-6u45-linux-x64.bin,hadoop-2.2.0.x86_64.tar.gz 修改主机名vim /etc/sysconfig ...
- Ubuntu下软件安装方式、PATH配置、查找安装位置
Ubuntu 18.04, 安装方式 目前孤知道的Ubuntu下安装软件方式有3种(命令): 1.make 2.apt/apt-get 3.dpkg 方式1基于软件源码安装,需要经历配置(可选).编译 ...
- Ubuntu 下 firebird 数据库的安装和配置
Ubuntu 下 firebird 数据库的安装和配置 1.简介 本文主要是 Ubuntu 下 firebird 数据库的安装和目录迁移,同样适用于 Debian 系统:Ubuntu 20.0.4 f ...
- Ubuntu 下 Apache2 和 PHP 服务器环境配置
Ubuntu 下 Apache2 和 PHP 服务器环境配置 1.简介 本文主要是 Ubuntu 下 Apache2 和 PHP 服务器环境配置方法,同样适用于 Debian 系统:Ubuntu 20 ...
- hadoop1.2.1伪分布模式配置
1.修改core-site.xml,配置hdfs <configuration> <property> <name>fs.default.name</name ...
- Hadoop伪分布模式配置
本作品由Man_华创作,采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可.基于http://www.cnblogs.com/manhua/上的作品创作. 请先按照上一篇文章H ...
- Hadoop伪分布模式配置部署
.实验环境说明 注意:本实验需要按照上一节单机模式部署后继续进行操作 1. 环境登录 无需密码自动登录,系统用户名 shiyanlou,密码 shiyanlou 2. 环境介绍 本实验环境采用带桌面的 ...
- ubantu18.04下Hadoop安装与伪分布式配置
1 下载 下载地址:http://mirror.bit.edu.cn/apache/hadoop/common/stable2/ 2 解压 将文件解压到 /usr/local/hadoop cd ~ ...
随机推荐
- [ios-必看] 国人当自强:两岸三地在线编程学习网站大搜罗 [转]
http://blog.csdn.net/lyy_whg/article/details/17350923 说到国内的在线编程学习网站,很多人都是一脸茫然,即使是资深开发者也是如此.在许多人眼中,尽管 ...
- 办理滑铁卢大学(本科)学历认证『微信171922772』UW学位证成绩单使馆认证University of Waterloo
办理滑铁卢大学(本科)学历认证『微信171922772』UW学位证成绩单使馆认证University of Waterloo QQ/微信171922772办理毕业证成绩单.真实使馆及教育部学历认证★诚 ...
- Java排序方法sort的使用详解
对数组的排序: //对数组排序 public void arraySort(){ int[] arr = {1,4,6,333,8,2}; Arrays.sort(arr);//使用java.util ...
- android 轮播图
轮播图是很常用的一个效果 核心功能已经实现 没有什么特殊需求 自己没事研究的 所以封装的不太好 一些地方还比较糙 为想要研究轮播图的同学提供个参考 目前测试图片为mipmap中的图片 没有写从网络加载 ...
- OpenH264
转自:http://blog.csdn.net/chinabinlang/article/details/41209053 目前最常用的264工程师x264: 最近有又有一个开源工程OpenH264, ...
- LocalDateTime返回的是Local时间
LocalDateTime返回的是本地时间,比如 LocalDateTime startDateTime = LocalDateTime.of(2016, 9, 18,00, 00); 返回的时间格式 ...
- grunt--自常用配置文件--js/样式压缩打包,sass工具整合使用
// Project configuration. module.exports = function(grunt) { // 使用严格模式 'use strict'; // 这里定义我们需要的任务 ...
- openui5的资料比较少
openui5的资料比较少,稳定优秀的开源框架,国内了解的人了了,都在追AngularJS.ExtJS.React. React比较新,非死不可出品而且裹挟Native的噱头.Mobile Nativ ...
- Hololens文件读写
unity 内勾选 RemovableStorage 选项或 Package.appxmanifest 勾选 可移动存储 选项 uwp app IO操作用 StreamReader 会提示没有权限,如 ...
- xml动态修改 dom4j修改
xml的动态修改需要传入的参数 xml的位置(tomcat中的发布位置).修改后的xml需要保存的位置(因为动态修改,所以建议和xml未修改前的位置相同).添加的节点的信息.或者修改的节点的信息 SA ...