Hadoop配置与安装

基础配置

1、关闭防火墙
        systemctl stop firewalld.service #停止firewall
        systemctl disable firewalld.service #禁止firewall开机启动
    查看防火墙状态
        firewall-cmd --state
        systemctl status firewalld.service
    启动防火墙
        systemctl start firewalld.service

2、修改主机名
    第一种
        hostnamectl set-hostname 名称
    第二种
        vim /etc/hostname
    查看主机名
        hostnamectl status

3.关闭networkmanage服务
    systemctl status NetworkManager #查看NetworkManager状态
    systemctl stop NetworkManager   #停止NetworkManager
    systemctl disable NetworkManager#禁止NetworkManager开机启动

4、修改ip地址

    vim /etc/sysconfig/network-scripts/ifcfg-ens33

    TYPE=Ethernet
    PROXY_METHOD=none
    BROWSER_ONLY=no
    BOOTPROTO=none
    DEFROUTE=yes
    IPV4_FAILURE_FATAL=no
    NAME=ens33
    DEVICE=ens33
    ONBOOT=yes
    IPADDR=192.168.174.200
    NETMASK=255.255.255.0
    GATEWAY=192.168.174.2
    DNS1=192.168.174.2

5.卸载自带jdk
    查看自带jdk
        rpm -qa |grep jdk
        注意：copy-jdk-configs-3.3-10.el7_5.noarch 不属于自带的，所以不用管
    卸载:
        rpm -e 自带jdk名称 --nodeps

6.安装jdk
    上传jdk1.8.0_171到/usr/local/module
    解压jdk到soft
        cd /usr/local/module 
        tar -zxvf jdk-8u171-linux-x64.tar.gz -C /usr/local/soft

    配置环境变量
        vim /etc/profile
        增加
            export JAVA_HOME=/usr/local/soft/jdk1.8.0_171
            export PATH=$PATH:$JAVA_HOME/bin
            
    检查jdk安装是否成功
        java -version

7.映射关系 ip地址主机名 linux配置路径 vim /etc/hosts windows配置路径 C:\Windows\System32\drivers\etc\hosts

8.修改启动级别之后重启
    systemctl set-default multi-user.target     #即将原来安装的含桌面的变成优先启动无界面的
    reboot                                      #重启
    
克隆两台然后  
9.免密配置
  1)创建秘钥
    ssh-keygen -t rsa           然后直接三次回车
    
  2)秘钥分发
    ssh-copy-id node1
    ssh-copy-id node2
    ssh-copy-id master
    
  注意:
    1、如果执行出错,进入/root/.ssh删除里面所有内容,从新执行
    2、master到master的免密登录也需要配置。因为有时候需要在当前结点启动进程，如不配此项到时候"启动/停止hadoop"是需要输入密码的。
    即 还需在master创建秘钥后，不仅要分发给node1、node2、还需要分发给master自身。
    3、故总结：
        搭建Hadoop时需要配免密登录的关系是：
            master ——>  node1
            master ——>  node2
            master ——>  master
            
    4、（此步骤可以配，但是没必要，故此处忽略！）搭建Hadoop是要求三台虚拟机都需要单独配免密，然后分别分发给另外两台。要求实现任意一台虚拟机都可免密登录另外的其它两台虚拟机。
    区别于取搭建"三台jdk"时的仅需配置master的免密，然后分发秘钥到node1、node2

10.检查免密是否配置成功
    cd /root/.ssh/
    ll
    当master中有
               authorized_keys  //(被分发秘钥的节点node1、node2中只有这一个文件)
               id_rsa           //私钥
               id_rsa.pub       //公钥
               known_hosts  这些文件都存在时，才表示"任意一台免密登录其它两台的"免密配置成功，
                            如果觉得有问题可删除这些文件后重新配免密

安装hadoop

上传hadoop-2.7.6.tar.gz 到 soft
解压:tar -zxvf hadoop-2.7.6.tar.gz -C /usr/local/soft/
        注意:必须在解压在/usr/local/soft/
        
配置环境变量:
    vim /etc/profile
添加: 
    export HADOOP_HOME=/usr/local/soft/hadoop-2.7.6
    PATH中新加$HADOOP_HOME/bin:$HADOOP_HOME/sbin
    
刷新配置文件使修改生效：
    source /etc/profile

1.修改slaves文件
    vim /usr/local/soft/hadoop-2.7.6/etc/hadoop/slaves 
删除原有内容
添加两个从节点主机名
    node1
    node2

2.修改hadoop-env.sh文件 
    vim /usr/local/soft/hadoop-2.7.6/etc/hadoop/hadoop-env.sh
删除/用#注释掉:
    export JAVA_HOME=${JAVA_HOME}
新加:
    export JAVA_HOME=/usr/local/soft/jdk1.8.0_171

3.修改core-site.xml文件
        vim /usr/local/soft/hadoop-2.7.6/etc/hadoop/core-site.xml
    在标签<configuration>  
        </configuration>中间复制上以下的内容

<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/soft/hadoop-2.7.6/tmp</value>
</property>
<property>
<name>fs.trash.interval</name>
<value>1440</value>
</property>

4.修改hdfs-site.xml文件
        vim /usr/local/soft/hadoop-2.7.6/etc/hadoop/hdfs-site.xml 
    在标签<configuration>  
        </configuration>中间复制上以下的内容

<property>
    <name>dfs.replication</name>
    <value>1</value>
</property>
<property>
    <name>dfs.permissions</name>
    <value>false</value>
</property>

5.修改yarn-site.xml文件

		vim /usr/local/soft/hadoop-2.7.6/etc/hadoop/yarn-site.xml

	在标签<configuration>

		</configuration>中间复制上以下的内容

<property>

<name>yarn.resourcemanager.hostname</name>

<value>master</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.log-aggregation-enable</name>

<value>true</value>

</property>

<property>

<name>yarn.log-aggregation.retain-seconds</name>

<value>604800</value>

</property>

6.修改mapred-site.xml文件

	先通过此配置文件的模板mapred-site.xml.template复制一个配置文件出来

		cp /usr/local/soft/hadoop-2.7.6/etc/hadoop/mapred-site.xml.template /usr/local/soft/hadoop-2.7.6/etc/hadoop/mapred-site.xml

	在打开文件编辑

		vim /usr/local/soft/hadoop-2.7.6/etc/hadoop/mapred-site.xml

	在标签<configuration>

		</configuration>中间复制上以下的内容

<property>

	<name>mapreduce.framework.name</name>

	<value>yarn</value>

</property>

<property>

	<name>mapreduce.jobhistory.address</name>

	<value>master:10020</value>

</property>

<property>

	<name>mapreduce.jobhistory.webapp.address</name>

	<value>master:19888</value>

</property>

7.将hadoop安装目录hadoop-2.7.6文件夹(含所有修改过的配置文件) 分发到 node1和node2

		scp -r /usr/local/soft/hadoop-2.7.6 node1:/usr/local/soft

		scp -r /usr/local/soft/hadoop-2.7.6 node2:/usr/local/soft

8.启动hadoop	（仅在master上操作即可）

	先在master中格式化hadoop原信息（如果没有刷新添加hadoop环境变量后的配置文件，则此步会报错）

	(仅第一次启动时执行)

		hdfs namenode -format

法一：直接启动hadoop中的所有进程

	再启动所有节点上的hadoop（仅在master上操作即可，仅第一次启动需要输入密码）

		start-all.sh		(配置过环境变量后，此启动命令可在任意目录执行)

法二：分开启动hadoop中的各部分，以达到启动hadoop的目的（同样仅在master上启动）

	先启动 hdfs

		start-dfs.sh

	再启动 yarn

		start-yarn.sh			两者都启动后，hadoop便完整启动了

验证是否启动成功

法一：
        用jps查看当前结点运行的所有java进程
            主节点进程：namenode/ secondarnamenode/resourcemanager
            子节点进程：datanode /nodemanager

法二：
    网页登录，验证HDFS的web界面
        google浏览器输入master:50070
        点击Datanodes，看其中有没有node1、node2。有则表示成功
        点击Utilities -> Browse the file system ,可查看file system（即HDFS存储的文件信息）（即可以浏览文件系统）
    
    补充：
        在HDFS中进行文件操作：
            在master中，启动hadoop后，在master的控制台中输入：
            hdfs dfs -“linux相关的命令”              //控制台没有输出代表成功执行
        举例：
            1、在HDFS中创建目录：
                hdfs dfs -mkdir /testHDFSShell      //刷新web网页后即可查看到刚刚创建的目录
            2、查看存储文件的HDFS中根目录信息的文件
                hdfs dfs -ls /
            
法三：
    网页登录，验证Yarn的web界面
        google浏览器输入master:8088

如果安装失败

1.关闭hadoop（在主节点）
    stop-all.sh
    如果关不掉就jps然后 （在所有节点）
    kill -9 端口号

2.需要手动将每个节点的tmp目录删除: 所有节点都要删除（在所有节点）
    rm -rf /usr/local/soft/hadoop-2.7.6/tmp

3.重新打开各个修改过得配置文件，看是否有问题
        
4.在主节点执行namenode格式化命令:
        hdfs namenode -format
        
5.启动hadoop
        start-all.sh

Hadoop配置与安装的更多相关文章

Hadoop配置安装手册
本次Hadoop集群安装一共使用四个节点,各节点IP如下: Master 172.22.120.191 Slave1 172.22.120.192 Slave2 172.22.120.193 Slav ...
Hadoop 2.4.0全然分布式平台搭建、配置、安装
一:系统安装与配置虚拟机软件:Virtualbox 4.3.10(已安装对应扩展包) 虚拟机:Ubuntu 13.04 LTS 32位(至于为什么选择13.04,是由于最新的版本号装上后开机会出现错 ...
Hadoop集群安装配置教程_Hadoop2.6.0_Ubuntu/CentOS
摘自:http://www.powerxing.com/install-hadoop-cluster/ 本教程讲述如何配置 Hadoop 集群,默认读者已经掌握了 Hadoop 的单机伪分布式配置,否 ...
Hadoop配置第2节-JDK的安装
Hadoop配置-JDK的安装总体目标:完成zookeeper+Hadoop+Hbase 整合平台搭建进度:1:集群网络属性配置2:集群免密码登陆配置3:JDK的安装4:Zookeeper的安 ...
Ubuntu16.04下Hadoop的本地安装与配置
一.系统环境 os : Ubuntu 16.04 LTS 64bit jdk : 1.8.0_161 hadoop : 2.6.4 部署时使用的用户名为hadoop,下文中需要使用用户名的地方请更改为 ...
Hadoop单机模式的配置与安装
Hadoop单机模式的配置与安装单机hadoop集群正常启动后进程情况 ResourceManager NodeManager SecondaryNameNode NameNode DataNode ...
三、hadoop、yarn安装配置
本文hadoop的安装版本为hadoop-2.6.5 关闭防火墙 systemctl stop firewalld 一.安装JDK 1.下载java jdk1.8版本,放在/mnt/sata1目录下, ...
hadoop集群安装配置详细教程
在上一篇的分享文章中我是给大家分享了运行部署hadoop的一些安装准备工作,这篇接上一篇继续为大家分享一些个人的学习经验总结.我学习用的是大快发行版DKHadoop,所以所有的经验分享都是以DKHad ...
Hbase的配置和安装
Hbase的配置和安装 1. 解压hbase.配置HBASE_HOME tar -zxvf hbase-1.2.4.tar.gz 2. 修改$HBASE_HOME/conf/hbase-env.sh文 ...

随机推荐

java中Object类的getClass方法有什么用以及怎么使用？
Object类的getClass的用法: Object类中有一个getClass方法,m a r k- t o- w i n:它会返回一个你的对象所对应的一个Class的对象,这个返回来的对象 ...
java中Super指向他紧邻的父类，而不是最底层的基类
3.2 当有两次继承时,演示super指向他紧邻的父类我们把上面的例子扩展成两次继承, 就看出:马克-to-win,Super是一个参考(或说指针)指向他紧邻的父类,而不是最底层的基类. 例1.3. ...
使用pyinstaller库打包文件
1.pyinstaller的安装先win+r打开cmd,安装具体命令如下: pip3 install pyinstaller 2.使用pyinstaller库打包文件假设Python源文件LPR ...
spring-Bean依赖注入-》普通数据类型
1.创建UserDao接口以及UserDaoImpl实现类(接口代码省略) public class UserDaoImpl implements UserDao { private String u ...
面试官：为什么Vue中的v-if和v-for不建议一起用?
一.作用 v-if 指令用于条件性地渲染一块内容.这块内容只会在指令的表达式返回 true值的时候被渲染 v-for 指令基于一个数组来渲染一个列表.v-for 指令需要使用 item in item ...
Codeforces Round #710 (Div. 3) Editorial 1506A - Strange Table
题目链接 https://codeforces.com/contest/1506/problem/A 原题 1506A - Strange Table Example input 5 1 1 1 2 ...
用于激光雷达的 APD，SPAD 和 SiPM 分析
1. 术语及定义 1.1 激光雷达,Light Detection And Range, LiDAR 发射激光光束,并接收回波以获取目标三维和/或速度信息的系统: 1.2 机械旋转激光雷达,Mech ...
Java语言学习day36--8月11日
###10集合迭代中的转型 A:集合迭代中的转型 a:在使用集合时,我们需要注意以下几点:  集合中存储其实都是对象的地址.  集合中可以存储基本数值吗?jdk1.5版本以后可以存储了. 因为出现 ...
Vite2+Vue3+ts的eslint设置踩坑
目录新项目了 Vite搭建 eslint 先安装eslint 创建.eslintrc.js 引入规则 Airbnb 配合prettier 对ts的支持 .eslintrc.js 在页面上查看esli ...
实践 - 搭建Redis一主两从三哨兵
实践 - 搭建Redis一主两从三哨兵原因: 最近在复习Redis的时候,学习到了为了提高Redis集群的高可用性,有一个模式为哨兵模式.哨兵模式的作用是为了在主节点出现阻塞或者错误,无法接收数据的 ...

Hadoop配置与安装

基础配置

安装hadoop

如果安装失败

Hadoop配置与安装的更多相关文章

随机推荐

热门专题