1.简介

HBase系统主要依赖于zookeeper和hdfs系统,所以部署HBase需要先去部署zookeeper和hadoop

2.部署开始

  IP或者HOSTNAME需要根据自身主机信息设定。

  部署资源:

      两个节点:xufeng-2(管理节点) xufeng-3(从节点)

xufeng-3 xufeng-2

zookeeper

namenode

SecondaryNameNode

master

datanode

regionserver

  部署版本:

      CDH5.4.2

  1.设定主机hostname

      #adduser hadoop  //添加一个用户
      #passwd hadoop   //修改密码

  2.设定主机hostame  

vi /etc/sysconfig/network

  3.设定hosts文件:

10.211.55.18 xufeng-
10.211.55.21 xufeng-

  4.拷贝安装包,按照如下设定安装包路径

  

  其中组件文件夹通过软连接到具体安装目录,配置文件独立于安装目录,这样便于后续版本的替换

  安装包可以去官网:http://archive.cloudera.com/cdh5/cdh/5/下载。

  5.安装jdk,如下版本,hadoop已经全面放弃了1.6版本,所以请安装1.7及以上版本

jdk-7u79-linux-x64.rpm

  6.设定无密码登录

hadoop用户下:

xufeng-3上执行:
ssh-keygen
cd ~/.ssh
scp id_rsa.pub xufeng-:/home/hadoop/.ssh/authorized_keys xufeng-2上执行
ssh-keygen
cd ~/.ssh
scp id_rsa.pub xufeng-:/home/hadoop/.ssh/authorized_keys
增加:
启动的时候需要ssh到自身,所以也需要将自身的公钥发布给自己:
在各个节点上执行:
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

  7.设定环境变量,通过环境变量的设定,各个服务可以找到对应的安装路径和配置文件路径  

[hadoop@xufeng- hbase-config]$ vi ~/.bash_profile 

#hadoop
export HADOOP_HOME=/opt/hadoop/hadoop
export HADOOP_CONF_DIR=/opt/hadoop/hadoop-config
export HADOOP_LOG_DIR=/opt/hadoop/hadoop/xufeng
#hbase
export HBASE_HOME=/opt/hadoop/hbase
export HBASE_CONF_DIR=/opt/hadoop/hbase-config #zookeeper
export ZOOKEEPER_HOME=/opt/hadoop/zookeeper
export ZOOCFGDIR=/opt/hadoop/zookeeper-config #spark
export SPARK_HOME=/opt/hadoop/spark
export SPARK_CONF_DIR=/opt/hadoop/spark-config PATH=$PATH:$HOME/bin:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$HBASE_HOME/bin:$ZOOKEEPER_HOME/bin:SPARK_HOME/bin export PATH

  配置文件和包分割开来,便于后续方便的替换包(版本)。

  8.【单节点】设定zookeeper,启动zookeeper

  a.将zookeeper安装包内的conf文件夹下的内容拷贝到zookeeper-config目录下,并生成zoo.cfg文件  

[hadoop@xufeng- bin]$ cd /opt/hadoop/zookeeper-config/
[hadoop@xufeng- zookeeper-config]$ ll
总用量
-rwxr-x---. hadoop hadoop 6月 : configuration.xsl
-rwxr-x---. hadoop hadoop 6月 : log4j.properties
-rw-rw-r--. hadoop hadoop 6月 : zoo.cfg
-rw-rw-r--. hadoop hadoop 6月 : zookeeper.out
-rwxr-x---. hadoop hadoop 6月 : zoo_sample.cfg

  zoo.cfg内容

[hadoop@xufeng- zookeeper-config]$ vi zoo.cfg 

tickTime=
dataDir=/opt/hadoop/hadoop_data/zookeeper
clientPort=
~

  b.启动zookeeper

zkServer.sh start

  检查线程

[hadoop@xufeng- zookeeper-config]$ jps
QuorumPeerMain
Jps

  9.设定hadoop,启动hadoop

  需要去主从节点上设定如下几个文件,这些文件都放在了/opt/hadoop/hadoop-config下,通过环境变量的指定进程能够读取到。

  其中如果无特殊需要hadoop-env.sh和log4j文件只从安装包中拷贝不修改。

core-site.xml
hdfs-site.xml
hadoop-env.sh
log4j.properties
slaves

  core-site.xml内容:

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://xufeng-3:9000</value>
<description>NameNode URI</description>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>file:///opt/hadoop/hadoop_data/hadoop/hdfs/temp</value>
<description>Abase for other temporary directories.</description>
</property>
</configuration>

  hdfs-site.xml内容:dfs.replication设定为1,因为我们只有一个datanode

<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:///opt/hadoop/hadoop_data/hdfs/namenode</value>
<description>NameNode directory for namespace and transaction logs storage.</description>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:///opt/hadoop/hadoop_data/hdfs/datanode</value>
<description>DataNode directory</description>
</property>
<property>
<name>dfs.replication</name>
<value></value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
<property>
<name>dfs.datanode.use.datanode.hostname</name>
<value>false</value>
</property>
<property>
<name>dfs.namenode.datanode.registration.ip-hostname-check</name>
<value>false</value>
</property>
<property>
<name>dfs.namenode.http-address</name>
<value>xufeng-:</value>
<description>Your NameNode hostname for http access.</description>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>xufeng-:</value>
<description>Your Secondary NameNode hostname for http access.</description>
</property>
</configuration>

  slaves内容: 只在xufeng-2这台机器上启动datanode

xufeng-

  启动hdfs

start-dfs.sh
注意:
听说centOS6有一个bug:
需要关闭防火墙才能联通端口: service iptables stop
chkconfig iptables off

  进入页面:hdfs安装完成: 

10,设定HBase,启动HBase

  的地水电费

  将配置文件从安装目录中拷贝到/opt/hadoop/hbase-config,主要有如下文件:

  

  其中hdfs-site.xml为软连接到hadoop的配置文件,因为HBase是作为hdfs的客户端角色。

  hbase-env.sh内容(修改点):不要让HBase使用集成的zookeeper,而是使用我们在xufeng-3上启动的zookeeper服务 

# Tell HBase whether it should manage it's own instance of Zookeeper or not.
export HBASE_MANAGES_ZK=false

  hbase-site.xml内容:

<configuration>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.rootdir</name>
<value>hdfs://xufeng-3:9000/hbase</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>xufeng-:</value>
</property>
</configuration>

  regionservers内容:只在xufeng-2这个从节点上启动regionserver服务

xufeng-

  

  在xufeng-3节点上启动HBase:

start-hbase.sh

  进入页面:HBase安装完成:

            

  

  

      

部署HBase系统(分布式部署)的更多相关文章

  1. 【Hadoop 分布式部署 一 :分布式部署准备虚拟机 】

    一.将IP配置为静态 按照 下面的操作将IP配置为静态IP  这个静态的IP地址 是你自己设置的,只要符合虚拟机的IP段就可以.最后点击 Apply  需要root密码 将网络断开 (在网络图标左键  ...

  2. 【Hadoop 分布式部署 五:分布式部署之分发、基本测试及监控】

    1.对  hadoop 进行格式化 到  /opt/app/hadoop-2.5.0  目录下 执行命令:    bin/hdfs namenode -format 执行的效果图如下  (  下图成功 ...

  3. 技术分享 | 在GreatDB分布式部署模式中使用Chaos Mesh做混沌测试

    GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源. 1. 需求背景与万里安全数据库软件GreatDB分布式部署模式介绍 1.1 需求背景 混沌测试是检测分布式系统不确定性.建 ...

  4. Hadoop及Zookeeper+HBase完全分布式集群部署

    Hadoop及HBase集群部署 一. 集群环境 系统版本 虚拟机:内存 16G CPU 双核心 系统: CentOS-7 64位 系统下载地址: http://124.202.164.6/files ...

  5. BI系统的分布式部署原理和技术实现

    1.什么是分布式 关于"分布式系统"的定义,我们先看下书中是怎么说的.<分布式系统原理和范型>一书中是这样定义分布式系统的:"分布式系统是若干独立计算机的集合 ...

  6. HBase独立集群部署

    HBase是分布式.面向列式存储的开源数据库,来源于Google的论文BigTable,HBase运行于Hadoop平台之上,不同于一般的关系数据库,是一个适合非结构化数据存储的分布式数据库 安装Hb ...

  7. Hadoop生态圈-flume日志收集工具完全分布式部署

    Hadoop生态圈-flume日志收集工具完全分布式部署 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任.   目前为止,Hadoop的一个主流应用就是对于大规模web日志的分析和处理 ...

  8. Hadoop1 Centos伪分布式部署

    前言:       毕业两年了,之前的工作一直没有接触过大数据的东西,对hadoop等比较陌生,所以最近开始学习了.对于我这样第一次学的人,过程还是充满了很多疑惑和不解的,不过我采取的策略是还是先让环 ...

  9. 项目分布式部署那些事(1):ONS消息队列、基于Redis的Session共享,开源共享

    因业务发展需要现在的系统不足以支撑现在的用户量,于是我们在一周之前着手项目的性能优化与分布式部署的相关动作. 概况 现在的系统是基于RabbitHub(一套开源的开发时框架)和Rabbit.WeiXi ...

随机推荐

  1. [BZOJ3380] [USACO2004 Open]Cave Cows 1 洞穴里的牛之一

    Description ​ 很少人知道其实奶牛非常喜欢到洞穴里面去探险. ​ 洞窟里有N(1≤N≤100)个洞室,由M(1≤M≤1000)条双向通道连接着它们.每对洞室间 至多只有一条双向通道.有K( ...

  2. SPOJ8222/NSUBSTR:Substrings——题解

    https://www.luogu.org/problemnew/show/SP8222#sub http://www.spoj.com/problems/NSUBSTR/ 翻译来自洛谷. 你得到一个 ...

  3. React高阶组件总结

    在多个不同的组件中需要用到相同的功能,这个解决方法,通常有Mixin和高阶组件. Mixin方法例如: //给所有组件添加一个name属性 var defaultMixin = { getDefaul ...

  4. 【优先队列】【UVa11997】K Smallest Sums

    传送门 Description Input Output Translation · 给定k个长度为k的数组,把每个数组选一个元素加起来,这样共有kk种可能的答案,求最小的k个 Sample Inpu ...

  5. 被引用的外部JS存在window.onload时,判断当前页面是否已存在window.onload,并进行相应处理

    如果页面a.html引用了b.js,b.js里的方法需要在页面资源加载完成后执行,即在window.onload里执行:这时如果a.html里使用了window.onload方法,b.js就不能重复调 ...

  6. PowerDesigner 技巧【1】

    Name与Code同步的问题: PowerDesigner中,修改了某个字段的name,其code也跟着修改,这个问题很讨厌,因为一般来说,name是中文的,code是字段名. 解决方法如下: 1.选 ...

  7. 背景建模技术(二):BgsLibrary的框架、背景建模的37种算法性能分析、背景建模技术的挑战

    背景建模技术(二):BgsLibrary的框架.背景建模的37种算法性能分析.背景建模技术的挑战 1.基于MFC的BgsLibrary软件下载 下载地址:http://download.csdn.ne ...

  8. ImageNet: what is top-1 and top-5 error rate?

    https://stats.stackexchange.com/questions/156471/imagenet-what-is-top-1-and-top-5-error-rate Your cl ...

  9. ICM Technex 2017 and Codeforces Round #400 (Div. 1 + Div. 2, combined) A map B贪心 C思路前缀

    A. A Serial Killer time limit per test 2 seconds memory limit per test 256 megabytes input standard ...

  10. @Autowired @Resource @Qualifier的区别

    参考博文: http://www.cnblogs.com/happyyang/articles/3553687.html http://blog.csdn.net/revent/article/det ...