Hadoop2.6.0伪分布环境搭建

用到的软件：

一、安装jdk：

1、要安装的jdk，我把它拷在了共享文件夹里面。

（用优盘拷也可以）

2、我把jdk拷在了用户文件夹下面。

（其他地方也可以，不过路径要相应改变）

3、执行复制安装解压命令：

解压完毕：

查看解压的文件夹：

4、配置环境变量：

写入如下5行代码：

使配置生效：

5、查看安装的jdk：

java -version

java

javac

二、SSH免密码登陆：

1、安装SSH：

2、是否生成 .ssh
目录：

3、如果没有生成，自己手动创建一个 .ssh 目录：

生成的 .ssh 目录：

4、生成公钥与私钥：

效果如下：

5、将公钥加入到用于认证的公钥文件中：

6、免密码登陆：

效果：

Ubuntu 免密码登陆，SSH配置完。

三、安装配置Hadoop：

1、复制安装解压Hadoop
：

解压完毕效果：

2、配置 etc/profile

3、配置 hadoop-env.sh

进入

4、修改hadoop-2.6.0文件权限为用户权限：

默认没有mapred-site.xml文件，复制mapred-site.xml.template一份，并把名字改为mapred-site.xml

5、配置下面4个重要文件：

mapred-site.xml

core-site.xml

hdfs-site.xml

yarn-site.xml

6、格式化：

格式化部分效果：

7、启动：

先启动 start-dfs.sh：

效果：

再启动 start-yarn.sh：

效果：

关闭hadoop：

（注：也可以 sbin/start-all.sh：建议分开启动。）效果一样，如下：

8、查看Web页面信息：

至此，hadoop-2.6.0伪分布配置成功。

附录：文字版

一. ubuntu下JDK的安装：

见Ubuntu中安装配置jdk。

二. ubuntu下安装ssh:

1. $ sudo apt-get install openssh-server （用此方法安装不成功，参考在Ubuntu中配置SSH）

2. 启动ssh：/etc/init.d/ssh start

3. $ ps -e | grep ssh 来验证是否启动sshserver

4. 免密码化

$ ssh-keygen -t rsa //生成密钥对

一直按Enter键，就会按照默认的选项将生成的密钥对保存在.ssh/id_rsa文件中。

$cd .ssh //进入.ssh目录

$cp id_rsa.pub authorized_keys

$ssh localhost

三. ubuntu下安装hadoop：

1. 下载hadoop-0.20.2.tar.gz，放在/opt下解压

2. 修改hadoop配置文件

conf/hadoop-env.sh 修改JAVA_HOME选项：

export JAVA_HOME=/usr/java/jdk1.6.0_24，一定记得去除前面的#

3. 伪分布式单机配置

conf/core-site.xml

<?xml version="1.0"?>
<?xml-stylesheet
type="text/xsl" href="configuration.xsl"?>

<configuration>
         <property>
                  <name>fs.default.name</name>
                  <value>hdfs://localhost:9000</value>
        </property>
</configuration>

conf/hdfs-site.xml:

<?xml version="1.0"?>
<?xml-stylesheet
type="text/xsl" href="configuration.xsl"?>

<configuration>
         <property>
                  <name>dfs.replication</name>
                   <value>1</value>
         </property>

<name>dfs.name.dir</name> //为了保证每次重启不用格式化

<value>/opt/hadoop-0.20.2/rq</value> //namenode，此处设置非常重要

</property>

<value>/opt/hadoop-0.20.2/rq/data</value>

</property>
</configuration>

conf/mapred-site.xml:

<?xml version="1.0"?>
<?xml-stylesheet
type="text/xsl" href="configuration.xsl"?>

<configuration>
        <property>
                 <name>mapred.job.tracker</name>
                          <value>localhost:9001</value>
        </property>
</configuration>

5. 创建hdfs文件系统

$ bin/hadoop namenode -format

6. 启动hadoop

需要先启动ssh: $ /etc/init.d/ssh start

$ bin/start-all.sh

7. 在hadoop下创建test目录，然后建立file1.txt file2.txt 写入几个单词；将hadoop/test下的测试文件上传到hadoop文件系统中

$ bin/hadoop dfs -put ./test input

8. 运行wordCount例子

$ bin/hadoop jar hadoop-0.20.2-examples.jar
wordcount input output

9. 把结果从dfs上拷贝下来

$ bin/hadoop dfs -get output output

10. 查看结果

$ cat output/* 也可以直接查看 $
bin/hadoop dfs -cat output/*

11. 停止hadoop运行

$ bin/stop-all.sh

12. 关闭ssh-server

$ /etc/init.d/ssh stop

Hadoop2.6.0伪分布环境搭建的更多相关文章

Hadoop2.5.0伪分布式环境搭建
本章主要介绍下在Linux系统下的Hadoop2.5.0伪分布式环境搭建步骤.首先要搭建Hadoop伪分布式环境,需要完成一些前置依赖工作,包括创建用户.安装JDK.关闭防火墙等. 一.创建hadoo ...
hadoop-2.7.1伪分布环境搭建
1.准备Linux环境 1.0 点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet i ...
在Win7虚拟机下搭建Hadoop2.6.0伪分布式环境
近几年大数据越来越火热.由于工作需要以及个人兴趣,最近开始学习大数据相关技术.学习过程中的一些经验教训希望能通过博文沉淀下来,与网友分享讨论,作为个人备忘. 第一篇,在win7虚拟机下搭建hadoop ...
Hadoop之伪分布环境搭建
搭建伪分布环境上传hadoop2.7.0编译后的包并解压到/zzy目录下 mkdir /zzy 解压 tar -zxvf hadoop.2.7.0.tar.gz -C /zzy 配置hado ...
分享一份关于Hadoop2.2.0集群环境搭建文档
目录一,准备环境三,克隆VM 四,搭建集群五,Hadoop启动与测试六,安装过程中遇到的问题及其解决方案一,准备环境 PC基本配置如下: 处理器:Intel(R) Core(TM) i5-3 ...
hive-2.2.0 伪分布式环境搭建
一,实验环境: 1, ubuntu server 16.04 2, jdk,1.8 3, hadoop 2.7.4 伪分布式环境或者集群模式 4, apache-hive-2.2.0-bin.tar. ...
Hadoop.2.x_伪分布环境搭建
一. 基本环境搭建 1. 设置主机名.静态IP/DNS.主机映射.windows主机映射(方便ssh访问与IP修改)等设置主机名: vi /etc/sysconfig/network # 重启系统生 ...
Spark2.4.0伪分布式环境搭建
一.搭建环境的前提条件环境:ubuntu-16.04 hadoop-2.6.0 jdk1.8.0_161. spark-2.4.0-bin-hadoop2.6.这里的环境不一定需要和我一样,基本版 ...
Ubuntu15.10下Hadoop2.6.0伪分布式环境安装配置及Hadoop Streaming的体验
Ubuntu用的是Ubuntu15.10Beta2版本,正式的版本好像要到这个月的22号才发布.参考的资料主要是http://www.powerxing.com/install-hadoop-clus ...

随机推荐

SQL指令中一些特别值得注意的地方
SQL基本指令要频繁使用,要是理解错了,将来工作一定会出现很大的麻烦.今天再重新梳理一下基本的SQL语法 SQL指令 in: 这个指令,我曾经发生过把它和python中的in搞混的错误.python中 ...
DataTable操作
一复制DataTable中符合条件的DataRow到新的DataTable中 One: DataTable TableTemp = new DataTable();//临时table DataTab ...
ZooKeeper之ZAB协议
ZooKeeper为高可用的一致性协调框架,自然的ZooKeeper也有着一致性算法的实现,ZooKeeper使用的是ZAB协议作为数据一致性的算法,ZAB(ZooKeeper Atomic Broa ...
ubuntu将命令写在一个文件里，执行文件，source命令
source命令也称为“点命令”,也就是一个点符号(.).source命令通常用于重新执行刚修改的初始化文件,使之立即生效,而不必注销并重新登录.用法: source filename 或 . fil ...
Windows Azure IP地址详解
Windows Azure上的IP地址有以下几种: 公网IP地址 VIP ILPIP Reserved IP 内网IP地址 DIP Static IP VIP是动态分配的公网IP,VIP可以被分配到云 ...
买错的电影票，含着泪也得看-LAMP搭建&Linux基础
hi 没说过,上周五室友过生请客,在龙湖里吃嗨了喝爽了,回去的路上侃侃而谈.说好的这周一起去看年内最后的大片,火星救援的,谁知道老子眼神不好,买错了电影的时间...把周六的约定提前到了今儿个下午,ma ...
[麦先生]SEO--相关优化【基础】
收录的一个重要原则:离首页的远近.离首页太远,不容易被收录.内页必须距离首页3-4次点击之内. 原因:1.对于一个网站来说,搜索引擎经常来的地方是首页,因为很多外部链接链向的是首页如友情链接.做的外链 ...
【HTML5】使用多媒体
HTML5 支持直接在浏览器中播放音频和视频文件,不需要使用Abode Flash这样的插件. 1. 使用 video 元素可以用video 元素在网页里嵌入视频内容. 其基本用法如下: <! ...
怎么实现ZBrush中Alt键和Shift键的灵活运用
ZBrush是一个数字雕刻和绘画软件,它以强大的功能和直观的工作流程彻底改变了整个三维雕刻行业.在一个简洁的界面中,ZBrush为当代数字艺术家提供了世界上最先进的工具.利用快捷键能使操作更快捷高效, ...
在JAVA中ArrayList如何保证线程安全
[b]保证线程安全的三种方法:[/b]不要跨线程访问共享变量使共享变量是final类型的将共享变量的操作加上同步一开始就将类设计成线程安全的, 比在后期重新修复它,更容易.编写多线程程序, 首先保证它 ...

Hadoop2.6.0伪分布环境搭建

Hadoop2.6.0伪分布环境搭建的更多相关文章

随机推荐

热门专题