网络上关于如何单机模式安装Hadoop的文章很多,按照其步骤走下来多数都失败,按照其操作弯路走过了不少但终究还是把问题都解决了,所以顺便自己详细记录下完整的安装过程。

此篇主要介绍在Ubuntu安装完毕后,如何进行Hadoop的安装和配置。

我所记录的笔记适合没有Linux基础的朋友跟我一起操作,同时欢迎高手参观指导。

环境约定

以下环境基于攥写时间:5th July 2015。

宿主机器:Windows 8

虚拟机环境:WMware Wrokstation 11

Ubuntu版本:Ubuntu Desktop 14.04.2

物理环境:

笔记本Thinkpad T420 i5 CPU 4+4=8G内存, 500G硬盘。

其它:

JavaJDK版本:7

Hadoop版本:2.7.0

首先,登录Ubuntu,进入到命令模式,可以通过两个方法,就是点击左上角的Search按钮,输入Ter然后在下面的结果界面就可以找到控制台Terminal。

另外一个方法就是通过快捷键Ctrl+Alt+T。

首先打开虚拟机的网络连接。Ubuntu的配置过程中包括更新和软件的安装都要以来于互联网环境。

回到控制台,输入如下命令开始更新系统(需联网)。sudo是经常会用到的,提示系统以最高权限运行,有些类似windows下的UAC。

sudo apt-get update

系统会提示输入密码,然后开始下载和安装更新。

完成更新后,接下来在系统中首先创建名称为hadoop的用户名和组。

首先创建组:

sudo addgroup Hadoop

然后再创建用户。

sudo adduser -ingroup hadoop Hadoop

输入这个命令后系统会提示输入密码,然后关于Full Name等信息一路回车就可以。

最后输入如下命令,使新建立的hadoop账户拥有最高的权限。

sudo gedit /etc/sudoers

系统会弹出Ubuntu Desktop的Gedit工具,这是一个可视化的文本编辑工具,跟windows下的记事本一样。在Ubuntu Server下没有图形化界面,可以通过vim完成类似的编辑和配置工作。

在打开的配置文件中,在root下面加入下面一行。

hadoop   ALL=(ALL:ALL) ALL

需要留意的是,如果手动敲入这行内容,hadoop后面跟的是/t,也就是键盘的Tab。如果这里输入不对的话会导致Ubuntu系统出现很大的问题。

编辑完成后点击Gedit上面的Save按钮然后关闭这个工具(Ubuntu Desktop下关闭和最大化等按钮是在每个窗体的左上方),回到控制台。

接下来配置ssh服务,使系统可以远程登录。

输入如下命令安装ssh。

sudo apt-get install openssh-server

然后通过如下命令开启ssh服务。

sudo /etc/init.d/ssh start

最后通过如下命令,查看ssh服务是否启动。

ps -e | grep ss

如图看到sshd的话说明ssh启动成功。

接下来配置ssh的免密码登录,确保其它节点可以不需要密码就可以登录到系统。(目前不太确定单击模式中这一步是否必要,但为了后续搭建多节点环境所以先跟着配置。)

首先输入如下命令生成公匙和私匙。

ssh-keygen -t rsa -P ""

然后通过如下命令把公匙的内容加入到authorized_keys中。

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

至此ssh的配置完成。

接下来安装java的jdk,输入如下命令开始安装。安装过程会略微长一些。

sudo apt-get install openjdk-7-jdk

安装完毕后,可以通过如下命令确定Java的版本。

java –version

接下来下载Hadoop。

打开Ubuntu Desktop的Firefox,输入以下网址:

http://hadoop.apache.org

找到页面的Get started,点击Download。

在下载页中,找到2.7.0版本的二进制下载链接。

然后系统会导航到另外一个下载页面,从众多地址中选择一个就可以了。

点击一个链接之后开始下载。

点击Save File之后,下载文件会默认存放在本地Ubuntu的Home/Wade/Downloads下,请留意Wade是我建立的用户名。

回到控制台,敲入cd命令,会回到/home/wade目录。所以直接敲入Downloads就可以进入到下载目录。

进入到Downloads目录后,输入如下指令将hadoop文件解压出来。

sudo tar xzf hadoop-2.7.0.tar.gz

然后使用下面的命令将解压后的目录移动到/usr/local/hadoop目录。

sudo mv hadoop-2.7.0 /usr/local/hadoop

接下来给前面建立的hadoop用户赋予相关的权限,否则hadoop用户无法配置这个目录下面的文件。

sudo chown -R hadoop:hadoop /usr/local/hadoop

接下来配置java home,首先通过如下命令确定java的安装位置。

update-alternatives - -config java

其中/usr/lib/jvm/java-7-openjdk-amd64是我们需要的部分。

接下来把这个配置到bashrc中,输入如下命令。

sudo gedit ~/.bashrc

系统会打开Gedit,然后把如下内容附加到文件的末尾。bashrc配置文件很重要,如果有差错会导致系统很大的问题。如果你的版本和前面的操作跟我的都一样的话,那么下面的配置内容是不需要更改的。

#HADOOP VARIABLES START

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64

export HADOOP_INSTALL=/usr/local/hadoop

export PATH=$PATH:$HADOOP_INSTALL/bin

export PATH=$PATH:$HADOOP_INSTALL/sbin

export HADOOP_MAPRED_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_HOME=$HADOOP_INSTALL

export HADOOP_HDFS_HOME=$HADOOP_INSTALL

export YARN_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native

export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib"

#HADOOP VARIABLES END

配置之后的文件。点击Save后关闭。

接下来通过如下命令使配置生效。

source ~/.bashrc

再输入如下命令,配置hadoop的环境文件。

sudo gedit /usr/local/hadoop/etc/hadoop/hadoop-env.sh

找到export JAVA段,配置成如下内容。

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64

配置后的文件如下图。

接下来通过如下命令让配置生效。

source /usr/local/hadoop/etc/hadoop/hadoop-env.sh

至此hadoop的配置工作完成。

接下来测试一下hadoop的环境,我们将运行一个hadoop自带的程序WordCount。

这个应用我们统计一下在hadoop目录下README.txt文件各个英文单词出现的次数。

首先使用以下命令定位到hadoop目录。

cd /usr/local/Hadoop

在这个目录下创建一个input文件夹。

sudo mkdir input

然后将README.txt文件夹复制到input文件夹下。

sudo cp README.txt input

然后运行如下命令开始统计。

sudo bin/hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.7.0-sources.jar org.apache.hadoop.examples.WordCount input output

看到如下输出说明执行成功了。

输入如下命令查看统计结果。(cat命令是显示文本内容的命令,如果编辑文件的话在ubuntu desktop下可以用gedit,server下可以用vim)

cat output/*

至此hadoop单击模式搭建完毕。

参考博客:

http://www.cnblogs.com/maybe2030/p/4591195.html

http://www.cnblogs.com/kinglau/p/3794433.html

注:其中第一个地址的内容有些细节在我这里无法走通,所以我这里根据其要表达的意思做了相关的修正。

Hadoop单机模式安装-(3)安装和配置Hadoop的更多相关文章

  1. Hadoop单机模式的配置与安装

    Hadoop单机模式的配置与安装 单机hadoop集群正常启动后进程情况 ResourceManager NodeManager SecondaryNameNode NameNode DataNode ...

  2. centos7 hadoop 单机模式安装配置

    前言 由于现在要用spark,而学习spark会和hdfs和hive打交道,之前在公司服务器配的分布式集群,离开公司之后,自己就不能用了,后来用ambari搭的三台虚拟机的集群太卡了,所以就上网查了一 ...

  3. Hadoop单机模式安装

    一.实验环境说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到桌面上的程序: ...

  4. Hadoop:Hadoop单机伪分布式的安装和配置

    http://blog.csdn.net/pipisorry/article/details/51623195 因为lz的linux系统已经安装好了很多开发环境,可能下面的步骤有遗漏. 之前是在doc ...

  5. 3-1.Hadoop单机模式安装

    Hadoop单机模式安装 一.实验介绍 1.1 实验内容 hadoop三种安装模式介绍 hadoop单机模式安装 测试安装 1.2 实验知识点 下载解压/环境变量配置 Linux/shell 测试Wo ...

  6. Hadoop单机模式安装-(2)安装Ubuntu虚拟机

    网络上关于如何单机模式安装Hadoop的文章很多,按照其步骤走下来多数都失败,按照其操作弯路走过了不少但终究还是把问题都解决了,所以顺便自己详细记录下完整的安装过程. 此篇主要介绍在虚拟机设置完毕后, ...

  7. Hadoop单机模式安装-(1)安装设置虚拟环境

    网络上关于如何单机模式安装Hadoop的文章很多,按照其步骤走下来多数都失败,按照其操作弯路走过了不少但终究还是把问题都解决了,所以顺便自己详细记录下完整的安装过程. 此篇主要介绍如何在Windows ...

  8. hadoop单机模式安装流程

    这里的安装是在Linux系统上安装的 参考博客 : https://blog.csdn.net/cafebar123/article/details/73500014 https://blog.csd ...

  9. 【大数据系列】hadoop单机模式安装

    一.添加用户和用户组 adduser hadoop 将hadoop用户添加进sudo用户组 sudo usermod -G sudo hadoop 或者 visudo 二.安装jdk 具体操作参考:c ...

随机推荐

  1. Mysql 查看、创建、更改 数据库和表

    一.一探究竟 我想看看有多少个数据库,有多少个表,以及表里有啥东西.那么你可以这样: 图形界面: 命令: 查看多少个数据库:注意 后面带s #查看 SHOW DATABASES; #查看表 USE b ...

  2. 数据存储_FMDB数据库队列

    一.代码示例 1.需要先导入FMDB框架和头文件,由于该框架依赖于libsqlite库,所以还应该导入该库. 2.代码如下: 1 // 2 // YYViewController.m 3 // 05- ...

  3. MySQL主从复制实现

    上回提到了用ThinkPHP框架来实现数据库的读写分离,现在就来简单说说MySQL的主从复制. 形式 一主一从(也就是这里要实现的形式) 主主复制 一主多从 多主一从(MySQL5.7开始支持) 联级 ...

  4. ZOJ3944 People Counting ZOJ3939 The Lucky Week (模拟)

    ZOJ3944 People Counting ZOJ3939 The Lucky Week 1.PeopleConting 题意:照片上有很多个人,用矩阵里的字符表示.一个人如下: .O. /|\ ...

  5. 海拔高度图*.dem文件的读取—vtkDEMReader

    vtkDEMReader reads digital elevation files and creates image data. Digital elevation files are produ ...

  6. CH模拟赛 还教室

    /* 区间操作,可以推一推式子,方差为平方的平均数-平均数的平方,维护区间和与区间平方和,平方和的维护方法类似,式子推一推就行了,注意约分 */ #include<iostream> #i ...

  7. 【UWP】解析GB2312、GBK编码网页乱码问题

    在WebHttpRequest请求网页后,获取到的中文是乱码,类似这样: <title>˹ŵ��Ϸ���������� - ��̳������ -  ˹ŵ��Ϸ����</title ...

  8. REDHAT一总复习1 NTP更改时区,并验证时区设置是否正确

    把计算机时区调整到巴哈马(这是个啥地方?听都没听过.) 使用 tzselect  进行确定时区,并进行可对话性的设置,按照对应的序号,射进去就行了. 使用:timedatectl set-timezo ...

  9. ionic的常用命令总结以及正式发布的准备

    常用命令: npm install -g ionic cordova(需要安装node) ionic start cutePuppyPics --v2(建app cutePuppyPics app名字 ...

  10. Sicily 1153: 马的周游问题(DFS+剪枝)

    这道题没有找到一条回路,所以不能跟1152一样用数组储存后输出.我采用的方法是DFS加剪枝,直接DFS搜索会超时,优化的方法是在搜索是优先走出度小的路径,比如move1和move2都可以走,但是如走了 ...