大数据学习——hadoop2.x集群搭建

1.准备Linux环境

    1.0先将虚拟机的网络模式选为NAT

    1.1修改主机名

        vi /etc/sysconfig/network

        NETWORKING=yes

        HOSTNAME=itcast    ###

    1.2修改IP

        两种方式：

        第一种：通过Linux图形界面进行修改（强烈推荐）

            进入Linux图形界面 -> 右键点击右上方的两个小电脑 -> 点击Edit connections -> 选中当前网络System eth0 -> 点击edit按钮 -> 选择IPv4 -> method选择为manual -> 点击add按钮 -> 添加IP：192.168.1.101 子网掩码：255.255.255.0 网关：192.168.1.1 -> apply

        第二种：修改配置文件方式（屌丝程序猿专用）

            vim /etc/sysconfig/network-scripts/ifcfg-eth0

            DEVICE="eth0"

            BOOTPROTO="static"               ###

            HWADDR="00:0C:29:3C:BF:E7"

            IPV6INIT="yes"

            NM_CONTROLLED="yes"

            ONBOOT="yes"

            TYPE="Ethernet"

            UUID="ce22eeca-ecde-4536-8cc2-ef0dc36d4a8c"

            IPADDR="192.168.1.101"           ###

            NETMASK="255.255.255.0"          ###

            GATEWAY="192.168.1.1"            ###

    1.3修改主机名和IP的映射关系

        vim /etc/hosts

        192.168.1.101    itcast

    1.4关闭防火墙

        #查看防火墙状态

        service iptables status

        #关闭防火墙

        service iptables stop

        #查看防火墙开机启动状态

        chkconfig iptables --list

        #关闭防火墙开机启动

        chkconfig iptables off

关闭linux服务器的图形界面：

vi /etc/inittab 

    1.5重启Linux

        reboot

2.安装JDK

    2.1上传alt+p 后出现sftp窗口，然后put d:\xxx\yy\ll\jdk-7u_65-i585.tar.gz

    2.2解压jdk

        #创建文件夹

        mkdir /home/hadoop/app

        #解压

        tar -zxvf jdk-7u55-linux-i586.tar.gz -C /home/hadoop/app

    2.3将java添加到环境变量中

        vim /etc/profile

        #在文件最后添加

        export JAVA_HOME=/home/hadoop/app/jdk-7u_65-i585

        export PATH=$PATH:$JAVA_HOME/bin

        #刷新配置

        source /etc/profile

3.安装hadoop2.4.1

    先上传hadoop的安装包到服务器上去/home/hadoop/

    注意：hadoop2.x的配置文件$HADOOP_HOME/etc/hadoop

    伪分布式需要修改5个配置文件

    3.1配置hadoop

    第一个：hadoop-env.sh

        vim hadoop-env.sh

        #第27行

        export JAVA_HOME=/usr/java/jdk1.7.0_65

    第二个：core-site.xml

        <!-- 指定HADOOP所使用的文件系统schema（URI），HDFS的老大（NameNode）的地址 -->

        <property>

            <name>fs.defaultFS</name>

            <value>hdfs://weekend-1206-01:9000</value>

        </property>

        <!-- 指定hadoop运行时产生文件的存储目录 -->

        <property>

            <name>hadoop.tmp.dir</name>

            <value>/home/hadoop/hadoop-2.4.1/tmp</value>

    </property>

    第三个：hdfs-site.xml

        <!-- 指定HDFS副本的数量 -->

        <property>

            <name>dfs.replication</name>

            <value>1</value>

    </property>

    <property>

              <name>dfs.secondary.http.address</name>

           <value>192.168.1.152:50090</value>

    </property>

    第四个：mapred-site.xml (mv mapred-site.xml.template mapred-site.xml)

        mv mapred-site.xml.template mapred-site.xml

        vim mapred-site.xml

        <!-- 指定mr运行在yarn上 -->

        <property>

            <name>mapreduce.framework.name</name>

            <value>yarn</value>

    </property>

    第五个：yarn-site.xml

        <!-- 指定YARN的老大（ResourceManager）的地址 -->

        <property>

            <name>yarn.resourcemanager.hostname</name>

            <value>weekend-1206-01</value>

    </property>

        <!-- reducer获取数据的方式 -->

    <property>

            <name>yarn.nodemanager.aux-services</name>

            <value>mapreduce_shuffle</value>

     </property>

    3.2将hadoop添加到环境变量

    vim /etc/proflie

        export JAVA_HOME=/usr/java/jdk1.7.0_65

        export HADOOP_HOME=/itcast/hadoop-2.4.1

        export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

    source /etc/profile

    3.3格式化namenode（是对namenode进行初始化）

        hdfs namenode -format (hadoop namenode -format)

    3.4启动hadoop

        先启动HDFS

        sbin/start-dfs.sh

        再启动YARN

        sbin/start-yarn.sh

    3.5验证是否启动成功

        使用jps命令验证

        27408 NameNode

        28218 Jps

        27643 SecondaryNameNode

        28066 NodeManager

        27803 ResourceManager

        27512 DataNode

        http://192.168.1.101:50070 （HDFS管理界面）

        http://192.168.1.101:8088 （MR管理界面）

4.配置ssh免登陆

    #生成ssh免登陆密钥

    #进入到我的home目录

    cd ~/.ssh

    ssh-keygen -t rsa （四个回车）

    执行完这个命令后，会生成两个文件id_rsa（私钥）、id_rsa.pub（公钥）

    将公钥拷贝到要免密登陆的目标机器上

    ssh-copy-id localhost

大数据学习——hadoop2.x集群搭建的更多相关文章

大数据之Linux服务器集群搭建
之前写过一篇关于Linux服务器系统的安装与网关的配置,那么现在我们要进一步的搭建多台Linux服务器集群. 关于单台服务器的系统搭建配置就不在赘述了,详情见https://www.cnblogs.c ...
大数据学习之hdfs集群安装部署04
1-> 集群的准备工作 1)关闭防火墙(进行远程连接) systemctl stop firewalld systemctl -disable firewalld 2)永久修改设置主机名 vi ...
Hadoop2.x 集群搭建
Hadoop2.x 集群搭建一些重复的细节参考Hadoop1.X集群完全分布式模式环境部署 1 HADOOP 集群搭建 1.1 集群简介 HADOOP 集群具体来说包含两个集群:HDFS 集群和YA ...
大数据 -- zookeeper和kafka集群环境搭建
一运行环境从阿里云申请三台云服务器,这里我使用了两个不同的阿里云账号去申请云服务器.我们配置三台主机名分别为zy1,zy2,zy3. 我们通过阿里云可以获取主机的公网ip地址,如下: 通过secu ...
大数据【一】集群配置及ssh免密认证
八月迷情,这个月会对大数据进行一个快速的了解学习. 一.所需工具简介首先我是在大数据实验一体机上进行集群管理学习,管理五台实验机,分别为master,slave1,slave2,slave3,cli ...
kafka学习(二)-zookeeper集群搭建
zookeeper概念 ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,它包含一个简单的原语集,分布式应用程序可以基于它实现同步服务,配置维护和命名服务等.Zookeeper是h ...
kafka学习(三)-kafka集群搭建
kafka集群搭建下面简单的介绍一下kafka的集群搭建,单个kafka的安装更简单,下面以集群搭建为例子. 我们设置并部署有三个节点的 kafka 集合体,必须在每个节点上遵循下面的步骤来启动 k ...
【转载】MQTT的学习之Mosquitto集群搭建
本文出自:http://www.cnblogs.com/yinyi521/p/6087215.html 文章钢要: 1.进行双服务器搭建 2.进行多服务器搭建一.Mosquitto的分布式集群部署 ...
redis 学习笔记-cluster集群搭建
一.下载最新版redis 编译目前最新版是3.0.7,下载地址:http://www.redis.io/download 编译很简单,一个make命令即可,不清楚的同学,可参考我之前的笔记: red ...

随机推荐

Codeforces Round #261 (Div. 2) A
Description Pashmak has fallen in love with an attractive girl called Parmida since one year ago... ...
洛谷 P4317 花神的数论题 || bzoj3209
https://www.lydsy.com/JudgeOnline/problem.php?id=3209 https://www.luogu.org/problemnew/show/P4317 设c ...
因磁盘空间不足导致HDFS的NameNode进入安全模式问题记录
因磁盘空间不足导致HDFS的NameNode进入安全模式问题记录,调用API上传及下载文件时报如下错误信息: org.apache.hadoop.ipc.RemoteException(org.apa ...
GDI双缓冲绘图
一.简介在进行复杂图形绘制时,若直接在屏幕DC上进行绘制,则会出现明显的闪烁.闪烁产生的原因是当绘制的图形较为复杂时,图形绘制过程中就被刷新到屏幕上,导致结果断断续续地显示出来.双缓冲绘图的原理是 ...
vue项目node升级后，node-saas报错解决办法
ERROR in ./node_modules/_extract-text-webpack-plugin@3.0.2@extract-text-webpack-plugin/dist/loader.j ...
Dynamic Median
题意: 设计一个数据结构,初始为空,支持以下操作: (1)增加一个元素,要求在log(n)时间内完成,其中n是该数据结构中当前元素的个数.注意:数据结构中允许有重复的元素. (2)返回当前元素集合的中 ...
ARM 环境下使用azure powershell 从远程blob中拉去vhd 并创建虚拟机
最近需要从指定公共访问的blob中复制vhd到自己的订阅存储账户,并使用vhd创建AZURE ARM虚拟机(非经典版),而且在portal.azure.cn中无法实现虚拟机映像创建等功能,于是自己使用 ...
Linux常用终端快捷键
UNIX程序员对键盘以及快捷键的设置都遵循一个标准:"手移动最少的距离,作更多的操作." 所有的类UNIX的终端上都有一些快捷键Ctrl+n = 下,Ctrl+b = 左,Ctrl ...
《Python基础教程》读书笔记第六章抽象函数参数
6.1创建函数函数是可以调用(可能包含参数,也就是放在圆括号中的值),它执行某种行为并且返回一个值.一般来说,内建的callable函数可以用来判断函数是否可调用: >>> x=1 ...
《Python基础教程》读书笔记第五章（上）条件语句
5.1 print和import的更多信息 5.1.1使用逗号输出打印多个表达式也是可行的,只要将它们用逗号隔开就好: >>>print'age:',42 age: 42 要同时输 ...

大数据学习——hadoop2.x集群搭建

大数据学习——hadoop2.x集群搭建的更多相关文章

随机推荐

热门专题