软件

  工具:vmware 10

  系统:centOS 6.5  64位

  Apache Hadoop: 2.5.2  64位

  Jdk:  1.7.0_75  64位

安装规划

  /opt/softwares/       ************* 软件包路径

        /modules/   *************  软件安装路径

安装准备

  1. 安装并配置jdk

# cd /opt/softwares/       --进入到软件包目录

# tar -zxvf jdk-7u75-linux-x64.tar.gz   --解压jdk tar包

# mv jdk1.7.0_75/ /opt/modules/  --复制到软件安装目录

# vi /etc/profile   --配置环境变量,在文件最后添加如下配置

export JAVA_HOME=/opt/modules/jdk1.7.0_75
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin

# source /etc/profile  --使环境变量立即生效

# java -version  --检查配置

  

  

  2. 创建用户账号

# groupadd hadoop   --添加hadoop用户组

# useradd -g hadoop hadoop  --添加hadoop用户并添加到hadoop组中

# passwd hadoop  --为hadoop用户设置密码

  

安装hadoop

  1. 解压hadoop

# tar -zxvf hadoop-2.5.2.tar.gz  --解压tar包

# mv hadoop-2.5.2 /opt/modules/  --复制到安装目录

# cd /opt/modules/

# chown -R hadoop:hadoop hadoop-2.5.2  --修改用户和组

  2. 配置环境变量

# vi /etc/profile  

export HADOOP_HOME=/opt/modules/hadoop-2.5.
export PATH=$PATH:$HADOOP_HOME/bin # source /etc/profile
# hadoop version --检查配置
Hadoop 2.5.
Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r cc72e9b000545b86b75a61f4835eb86d57bfafc0
Compiled by jenkins on --14T23:45Z
Compiled with protoc 2.5.
From source with checksum df7537a4faa4658983d397abf4514320
This command was run using /opt/modules/hadoop-2.5./share/hadoop/common/hadoop-common-2.5..jar # hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5..jar pi --解压后无需配置即可运行于独立模式下,例:计算π值

  3. 配置SSH免密码登陆  

  hadoop用户下执行

$  ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

$  cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

$  chmod 644 authorized_keys  --权限修改为rw-r-r

  4. 配置hdfs

  a. 修改hadoop-2.5.2/etc/hadoop目录下配置文件

  > hadoop-env.sh

# vi hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1.7.0_75  --显式配置JAVA_HOME,而非使用JAVA_HOME=${JAVA_HOME}

  >core-site.xml

# vi core-site.xml

<configuration>

<property>      --指定文件系统及主机、端口

<name>fs.defaultFS</name>

<value>hdfs://localhost:9000</value>

</property>

</configuration>

 

  >hdfs-site.xml

# vi hdfs-site.xml

<configuration>

<property>  --配置副本数量,默认为3,伪分布式下若不配置,则会提示副本数不足

<name>dfs.replication</name>

<value>1</value>

</property>

</configuration>

  b. 格式化文件系统

$ mkdir -p /opt/data/hadoop/hdfs/name    --创建namenode文件存储目录

$ mkdir -p /opt/data/hadoop/hdfs/data     --创建datanode数据存储目录

$ vi hdfs-site.xml

<property>   --默认存储在/tmp/hadoop-hadoop/dfs/name目录下,清空缓存时,集群数据丢失,且无法重建,后果非常严重
        <name>dfs.namenode.name.dir</name>
        <value>/opt/data/hadoop/hdfs/name</value>
</property>
<property>
        <name>dfs.datanode.data.dir</name>
        <value>/opt/data/hadoop/hdfs/data</value>
</property>

$ hdfs namenode –format

  c. 启动namenode和datanode守护进程

$ ./sbin/start-dfs.sh   --启动hdfs

$ jps   --进程查看

SecondaryNameNode   
Jps
DataNode
NameNode

  通过访问localhost:50070访问namenode web页面

  5. 启动yarn

  a. 修改hadoop-2.5.2/etc/hadoop目录下配置文件

  > mapred-site.xml

$ cp mapred-site.xml.template mapred-site.xml  --复制模板文件,并命名为mapred-sit.xml

$ vi mapred-site.xml

<property>   --local:本地作业运行器  classic:经典mapreduce框架  yarn:新框架

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

  >yarn-site.xml

$ vi yarn-site.xml

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

  b. 启动yarn

$ ./sbin/start-yarn.sh

$ jps

SecondaryNameNode   
Jps
DataNode
NameNode
ResourceManager
NodeManager

  通过localhost:8088访问ResourceManager web页面

hadoop2.5.2学习及实践笔记(一)—— 伪分布式学习环境搭建的更多相关文章

  1. Hadoop2.0伪分布式平台环境搭建

    一.搭建环境的前提条件 环境:ubuntu-16.04 hadoop-2.6.0  jdk1.8.0_161.这里的环境不一定需要和我一样,基本版本差不多都ok的,所需安装包和压缩包自行下载即可. 因 ...

  2. hadoop2.5.2学习及实践笔记(二)—— 编译源代码及导入源码至eclipse

    生产环境中hadoop一般会选择64位版本,官方下载的hadoop安装包中的native库是32位的,因此运行64位版本时,需要自己编译64位的native库,并替换掉自带native库. 源码包下的 ...

  3. hadoop2.5.2学习及实践笔记(四)—— namenode启动过程源码概览

    对namenode启动时的相关操作及相关类有一个大体了解,后续深入研究时,再对本文进行补充 >实现类 HDFS启动脚本为$HADOOP_HOME/sbin/start-dfs.sh,查看star ...

  4. Java web与web gis学习笔记(一)——Tomcat环境搭建

    系列链接: Java web与web gis学习笔记(一)--Tomcat环境搭建 Java web与web gis学习笔记(二)--百度地图API调用 JavaWeb和WebGIS学习笔记(三)-- ...

  5. ASP.NET Core on K8S学习初探(1)K8S单节点环境搭建

    当近期的一个App上线后,发现目前的docker实例(应用服务BFF+中台服务+工具服务)已经很多了,而我司目前没有专业的运维人员,发现运维的成本逐渐开始上来,所以容器编排也就需要提上议程.因此我决定 ...

  6. 【零基础学习FreeRTOS嵌入式系统】之一:FreeRTOS环境搭建

    [零基础学习FreeRTOS嵌入式系统]之一:FreeRTOS环境搭建 一:FreeRTOS系统下载 在官网上https://www.freertos.org/,找到下载入口. 或直接进入下载地址ht ...

  7. Hadoop2.6.0实践:001 伪分布式环境搭建

    ##################### Centos6.4VM_01_os.rar ################################################准备工作/opt ...

  8. Scala学习笔记(一):环境搭建

    计算机领域的编程语言种类繁多,如C.C++.Java.C#等,我们知道的一般都是较为流行的编程语言,然有更多的是没听说过的,于是也就说不上关注或者使用了 一次在网上查资料时,无意间看到了“函数式编程” ...

  9. Hadoop学习笔记(一):ubuntu虚拟机下的hadoop伪分布式集群搭建

    hadoop百度百科:https://baike.baidu.com/item/Hadoop/3526507?fr=aladdin hadoop官网:http://hadoop.apache.org/ ...

随机推荐

  1. wordpress问题集锦

    1.内容不自动换行 找到对应的样式,添加如下代码,width根据具体情况修改. width:640px;white-space:normal;word-break:break-all;word-wra ...

  2. 第37章 基于SD卡的FatFs文件系统—零死角玩转STM32-F429系列

    第37章     基于SD卡的FatFs文件系统 全套200集视频教程和1000页PDF教程请到秉火论坛下载:www.firebbs.cn 野火视频教程优酷观看网址:http://i.youku.co ...

  3. jQuery与Aiax应用

    Ajax(一部JavaScript和XML) 优势: ①不需要插件支持 ②优秀的用户体验:能在不刷新整个页面的前提下更新数据,这使得web应用程序能更为迅速地回应用户的操作. ③提高web程序的性能: ...

  4. this指向问题(1)

    在JS中,this一般有四种绑定的方式,但是在确定到底是哪种绑定之前必须先找到函数的调用位置.接下来先介绍其中的三种: 1.默认绑定 其实所谓的默认绑定就是函数直接调用(前面没有什么东西来点它),在默 ...

  5. JAVA通用BaseServlet的产生和代码实现

    BaseServlet的作用: 我们先写一个工具类:BaseServlet. 我们知道,写一个项目可能会出现N多个Servlet,而且一般一个Servlet只有一个方法(doGet或doPost),如 ...

  6. 工具类(为控件设置色值) - iOS

    为了便于日常开发效率,因此创建了一些小的工具类便于使用.具体 code 如下:声明: /* 为控件设置色值 */ #import <UIKit/UIKit.h> @interface UI ...

  7. hdu_1573_X问题 (分段之中国剩余

    求在小于等于N的正整数中有多少个X满足:X mod a[0] = b[0], X mod a[1] = b[1], X mod a[2] = b[2], …, X mod a[i] = b[i], … ...

  8. REST Adapter实现SAP PI中的增强XML/JSON格式转换(转载)

    SAP标准的REST adapter有着XML/JSON转换的功能,它很有用,因为一方面SAP PI/PO内部以XML格式处理数据,而另一方面,在处理REST架构风格的时候,JSON才是事实上的格式. ...

  9. javascript中string对象方法中的slice、substring、substr的区别联系

    1.slice.substring.snustr均属于String的对象方法,用于截取或提取字符串片段,三者均布破坏原先的字符串,而是以新的字符串返回被提取的部分. <script> va ...

  10. #Python编程从入门到实践#第四章笔记

    #Python编程从入门到实践#第四章笔记   操作列表 ​​​1.遍历列表 使用for循环,遍历values列表 for value in values: print(value) 2.数字列表 使 ...