hadoop/hbase/hive单机扩增slave

原来只有一台机器，hadoop,hbase,hive都安装在一台机器上，现在又申请到一台机器，领导说做成主备，

要重新配置吗？还是原来的不动，把新增的机器做成slave，原来的当作master？网上找找应该有这种配置操作，先试试看

原来搭单机hadoop，单机hadoop搭建

原来搭建单机hbase，单机hbase搭建

原来搭建单机zookeeper三个节点，单机伪zookeeper集群

１.申请到机器了，先把主机名改成slave

vim /etc/sysconfig/network

HOSTNAME=slave

2.添加２台机器信任关系

1），进入master机器的/root/.ssh目录，

检查该目录下是否有id_rsa和id_rsa.pub文件，

如果没有，执行ssh-keygen -t rsa 命令，生成私钥和公钥。

２）在主机master中添加自己的私钥：ssh-add  id_rsa
    注：很多介绍中都少了第二步，所以经常出现测试时不通过的情形。
           ssh-add id_rsa
           # 如果提示 could not open a connection to your authentication agent
           终端做如下操作:
           ssh-agent bash
           ssh-add id_rsa

３）将主机master中的公钥id_rsa.pub拷贝到主机slave的.ssh目录下，authorized_keys文件中。

scp -r /root/.ssh/id_rsa.pub 192.168.1.197:/root/.ssh/authorized_keys

４）将主机slave 中的authorized_keys改为只有当前用户有读写权限:chmod 600 authorized_keys

５）在master中登录slave

>ssh 192.168.1.197　　果然不需要密码直接登录了

将id_rsa.pub加入到授权的key中

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

就可以自己登录自己了：

> ssh master

６）在slave机器中生成私钥和公钥

进入slave机器的/root/.ssh目录，

检查该目录下是否有id_rsa和id_rsa.pub文件，

如果没有，执行ssh-keygen -t rsa 命令，生成私钥和公钥

７）在主机slave中添加自己的私钥：ssh-add  id_rsa
    注：很多介绍中都少了第二步，所以经常出现测试时不通过的情形。
           ssh-add id_rsa
           # 如果提示 could not open a connection to your authentication agent
           终端做如下操作:
           ssh-agent bash
           ssh-add id_rsa

８）将主机slave中的公钥id_rsa.pub拷贝到主机master的.ssh目录下，authorized_keys文件中。

scp -r /root/.ssh/id_rsa.pub 192.168.1.166:/root/.ssh/authorized_keys

９）在slave主机上登录master

>ssh 192.168.1.166 果然不需要密码

３.将master上安装配置的hadoop拷贝到slave上一份

scp -r /hadoop root@ 192.168.1.197:/

修改slave：/hadoop/hadoop-2.8.4/etc/hadoop中相关配置文件

１）hadoop-env.sh　　不改

２）yarn-env.sh 　　不改

３）修改　core-site.xml文件

<configuration>

        <property>

                <name>hadoop.tmp.dir</name>

                <value>/root/hadoop/tmp</value>

                <description>hadoop tmp dir</description>

        </property>

        <property>

                <name>fs.default.name</name>

                <value>hdfs://slave:9000</value>

        </property>

</configuration>

４）hdfs-site.xml　　不改，但要创建

/root/hadoop/dfs/name

/root/hadoop/dfs/data
目录

５）修改mapred-site.xml

<property>

    <name>mapred.job.tracker</name>

    <value>slave:9001</value>

</property>

<property>

      <name>mapred.local.dir</name>

       <value>/root/hadoop/var</value>

</property>

<property>

       <name>mapreduce.framework.name</name>

       <value>yarn</value>

</property>

６）修改slaves

>vi slaves

master

slave

４.master和slave配置

在master和slave上都配置hosts

>vi /etc/hosts　内容如下

192.168.1.166 master

192.168.1.197 slave

发现slave机器上的java版本跟master不同，把master上安装的java拷贝到slave上，配置下环境变量就ＯＫ

５.hadoop集群如何启动？

进入master：/hadoop/hadoop-2.8.4/sbin目录

>start-dfs.sh 启动HDFS　　因为之前已经格式化了，不用再格式化

　　　　　　　　　　　　　此命令会启动(master)本机上namenode 、datanode、secondarynamenode 和slave上的datanode

>start-yarn.sh 启动yarn集群此命令会先启动本地(master)的resourcemanager，在远程到slave上启动nodemanager。

本以为启动成功了，浏览器访问，发现只有一个节点，是不是从节点slave没启动起来呢？

只能继续检查配置文件，一项项检查

１)hadoop-env.sh　　不用改，只配置export JAVA_HOME

２)core-site.xml要修改，看错了，原来单机配置

单机配置：
<property>

　　<name>fs.default.name</name>

   <value>hdfs://master:9000</value>

</property>
集群配置：

<property>

　　<name>fs.defaultFS</name>

   <value>hdfs://master:9000</value>

</property>
对应的slave要修改成：

<property>

　　<name>fs.defaultFS</name>

   <value>hdfs://slave:9000</value>

</property>

３）hdfs-site.xml　　不修改

４）mapred-site.xml　修改　　master / slave 对应主机上修改下：

<configuration>

        <property>

                <name>mapred.job.tracker</name>

                <value>slave:9001</value>

        </property>

        <property>

                <name>mapred.local.dir</name>

                <value>/root/hadoop/var</value>

        </property>

        <property>

                <name>mapreduce.framework.name</name>

                <value>yarn</value>

        </property>

</configuration>

５）yarn-site.xml　　master / slave 对应主机上修改下：

<!-- 指定YARN的老大（ResourceManager）的地址 -->

   <property>

        <name>yarn.resourcemanager.hostname</name>

        <value>master</value>

    </property>

   <!-- reducer获取数据的方式 -->

   <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

   </property>

修改完，在master上

> stop-dfs.sh 停止HDFS

>stop-yarn.sh 停止yarn

再启动

> start-dfs.sh 启动HDFS

>start-yarn.sh 停止yarn

访问浏览器，发现还是只有一个存活节点，难道又失败了？

回头看了下启动日志：

start-dfs.sh　启动HDFS时，slave也启动了，并没有失败

start-yarn.sh　启动yarn时，slave也启动了

为啥nodes节点只有一个呢？

查看master上进程：

查看slave上进程：

也有一个DataNode，为什么浏览器上只能看到一个节点呢？

hadoop/hbase/hive单机扩增slave的更多相关文章

【转载】全栈工程师-Hadoop, HBase, Hive, Spark
学习参考这篇文章: http://www.shareditor.com/blogshow/?blogId=96 机器学习.数据挖掘等各种大数据处理都离不开各种开源分布式系统, hadoop用于分布式存 ...
[转载] Hadoop和Hive单机环境搭建
转载自http://blog.csdn.net/yfkiss/article/details/7715476和http://blog.csdn.net/yfkiss/article/details/7 ...
cdh版本的hue安装配置部署以及集成hadoop hbase hive mysql等权威指南
hue下载地址:https://github.com/cloudera/hue hue学习文档地址:http://archive.cloudera.com/cdh5/cdh/5/hue-3.7.0-c ...
hadoop,hbase,hive
linux上安装hadoop,然后安装hbase,然后安装zookeeper,最后安装hive.hbase安装在hdfs下.hive是纯逻辑表,hbase是物理表.hdfs是hadoop上的一个组件.
大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建图文详解
引言在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单 ...
Hadoop+HBase+Spark+Hive环境搭建
杨赟快跑简书作者 2018-09-24 10:24 打开App 摘要:大数据门槛较高,仅仅环境的搭建可能就要耗费我们大量的精力,本文总结了作者是如何搭建大数据环境的(单机版和集群版),希望能帮助学弟 ...
大数据Hadoop核心架构HDFS+MapReduce+Hbase+Hive内部机理详解
微信公众号[程序员江湖] 作者黄小斜,斜杠青年,某985硕士,阿里 Java 研发工程师,于 2018 年秋招拿到 BAT 头条.网易.滴滴等 8 个大厂 offer,目前致力于分享这几年的学习经验. ...
Hadoop核心架构HDFS+MapReduce+Hbase+Hive内部机理详解
转自:http://blog.csdn.net/iamdll/article/details/20998035 分类: 分布式 2014-03-11 10:31 156人阅读评论(0) 收藏举报 ...
[转]云计算之hadoop、hive、hue、oozie、sqoop、hbase、zookeeper环境搭建及配置文件
云计算之hadoop.hive.hue.oozie.sqoop.hbase.zookeeper环境搭建及配置文件已经托管到githubhttps://github.com/sxyx2008/clou ...

随机推荐

Leetcode之53. Maximum Subarray Easy
Leetcode 53 Maximum Subarray Easyhttps://leetcode.com/problems/maximum-subarray/Given an integer arr ...
oracle+mybatis批量插入踩坑记
最近在项目中需要使用oracle+mybatis批量插入数据,因为自增主键,遇到问题,现记录如下: 一.常用的两种sql写法报错 1.insert ... values ... <insert ...
安装gnocchi
在控制节点上执行 #!/bin/bash MYSQL_ROOT_PASSWD='m4r!adbOP' GNOCCHI_PASSWD='gnocchi1234!' CEILOMETER_PASSWD=' ...
什么是阿里云ACA认证
阿里云云计算助理工程师认证(ACA -  Alibaba Cloud Certified Associate)是面向使用阿里云基础产品的专业技术认证,主要涉及阿里云的计算.存储.网络.安全类的核心产品 ...
dubbo分布式服务框架-study1
本文参考“如何给老婆解释RPC”一文进行的... 1.首先了解下dubbo: dubbo是一款高性能.轻量级的开源java RPC服务框架(RPC即远程过程调用,具体解释见:https://www.j ...
「java.util.concurrent并发包」之 CountDownLatch
一 CountDownLatch是什么 CountDownLatch是在java1.5被引入的,跟它一起被引入的并发工具类还有CyclicBarrier.Semaphore.ConcurrentHas ...
题解 P3627 【[APIO2009]抢掠计划】
咕了四个小时整整一晚上 P3627 [APIO2009] 抢掠计划(https://www.luogu.org/problemnew/show/P3627) 不难看出答案即为该有向图的最长链长度(允许 ...
luffy前台配置
目录 axios前后台交互 cokies操作 element-ui页面组件框架 bootstrap页面组件框架前端主页图片准备页头组件:components/Header.vue 轮播图组件:c ...
TensorFlow实现一个简单线性回归的例子
__author__ = "WSX" import tensorflow as tf import numpy as np import matplotlib.pyplot as ...
List与Set区别
List: 元素有序放入,元素可重复 Set: 元素无序保存,元素不可重复(通过==判断,非基本类型判断的是引用地址),因为set是无序的,故只能通过迭代器循环.ps:说是无序,但是其实set中的元素 ...

hadoop/hbase/hive单机扩增slave

hadoop/hbase/hive单机扩增slave的更多相关文章

随机推荐

热门专题