hbase replication原理分析

本文只是从总体流程来分析replication过程，很多细节没有提及，下一篇文章准备多分析分析细节。

replicationSource启动过程

org.apache.hadoop.hbase.regionserver.HRegionServer#startServiceThreads ->

org.apache.hadoop.hbase.replication.regionserver.Replication#startReplicationService ->

//初始化replicationManager

org.apache.hadoop.hbase.replication.regionserver.ReplicationSourceManager#init ->

//在init阶段for循环把所有的replicationPeers添加到source里，即每个replicationPeer对应一个source，也就是可以添加多个slave cluster，replicationPeers从zookeeper /hbase/replication/peers目录取

org.apache.hadoop.hbase.replication.regionserver.ReplicationSourceManager#addSource ->

//在addSource阶段生成ReplicationSource并启动ReplicationSource，ReplicationSource本身是一个线程

org.apache.hadoop.hbase.replication.regionserver.ReplicationSource#startup

//ReplicationSource线程启动，进入while循环工作

replicationSource大致工作流程

while(isAlive())进行主体循环
从WAL文件获取List<WAL.Entry>
通过调用shipEdits方法发送数据
调用replicationEndpoint replicate方法发送数据
最终调用admin.replicateWALEntry通过rpc发送数据

regionserver如何从slave cluster中选取regionserver当做复制节点

replication过程需要连接peer（slave cluster），首先要获取这个peer所有活着的regionservers
拿到所有regionservers信息之后，开始选择哪些regionservers作为replication的对象
选哪些regionservers当做sink由peer活着的regionserver个数*ratio（默认值0.1）决定，regionservers先shuffle打乱顺序后再截取
如果选择的sink（regionserver）个数为0，一直等待peer上线，也就是slave cluster没有启动的情况
下面源码可以解释如何选择regionserver当做sink

  private void connectToPeers() {

    getRegionServers();

    int sleepMultiplier = 1;

    // Connect to peer cluster first, unless we have to stop

    while (this.isRunning() && replicationSinkMgr.getSinks().size() == 0) {

      replicationSinkMgr.chooseSinks();

      if (this.isRunning() && replicationSinkMgr.getSinks().size() == 0) {

        if (sleepForRetries("Waiting for peers", sleepMultiplier)) {

          sleepMultiplier++;     //倍数最多为默认配置的300倍，也就是每次sleep最长间隔是300秒

        }

      }

    }

  }

  void chooseSinks() {

    List<ServerName> slaveAddresses = endpoint.getRegionServers();

    Collections.shuffle(slaveAddresses, random);

    int numSinks = (int) Math.ceil(slaveAddresses.size() * ratio);

    sinks = slaveAddresses.subList(0, numSinks);

    lastUpdateToPeers = System.currentTimeMillis();

    badReportCounts.clear();

  }

  /**

   * Do the sleeping logic

   * @param msg Why we sleep

   * @param sleepMultiplier by how many times the default sleeping time is augmented

   * @return True if <code>sleepMultiplier</code> is &lt; <code>maxRetriesMultiplier</code>

   */

  protected boolean sleepForRetries(String msg, int sleepMultiplier) {

    try {

      if (LOG.isTraceEnabled()) {

        LOG.trace(msg + ", sleeping " + sleepForRetries + " times " + sleepMultiplier);

      }

      Thread.sleep(this.sleepForRetries * sleepMultiplier);

    } catch (InterruptedException e) {

      LOG.debug("Interrupted while sleeping between retries");

    }

    return sleepMultiplier < maxRetriesMultiplier;

  }

this.maxRetriesMultiplier = this.conf.getInt("replication.source.maxretriesmultiplier", 300);

this.ratio = conf.getFloat("replication.source.ratio", DEFAULT_REPLICATION_SOURCE_RATIO);

总结

每个slave cluster对应一个replicationSource线程，各个slave复制互不干扰
每个replicationSource是单线程进行传输数据，改成多线程并发传可能更好
数据是通过rpc发送过去，调用slave cluster regionserver RSRpcServices的replicateWALEntry方法

hbase replication原理分析的更多相关文章

HBase的replication原理及部署
一.hbase replication原理 hbase 的复制方式是 master-push 方式,即主集群推的方式,主要是因为每个rs都有自己的WAL. 一个master集群可以复制给多个从集群,复 ...
1、Hbase原理分析
一.Hbase介绍 1.1.对Hbase的认识 HBase作为面向列的数据库运行在HDFS之上,HDFS缺乏随机读写操作,HBase正是为此而出现. HBase参考 Google 的 Bigtable ...
flink-----实时项目---day07-----1.Flink的checkpoint原理分析 2. 自定义两阶段提交sink（MySQL） 3 将数据写入Hbase（使用幂等性结合at least Once实现精确一次性语义） 4 ProtoBuf
1.Flink中exactly once实现原理分析生产者从kafka拉取数据以及消费者往kafka写数据都需要保证exactly once.目前flink中支持exactly once的sourc ...
HBase replication
Hbase Replication 介绍现状 Hbase 的replication目前在业界使用并不多见,原因有很多方面,比如说HDFS目前已经有多份备份在某种程度上帮助HBASE底层数据的安全性, ...
Hadoop 综合揭秘——HBase的原理与应用
前言现今互联网科技发展日新月异,大数据.云计算.人工智能等技术已经成为前瞻性产品,海量数据和超高并发让传统的 Web2.0 网站有点力不从心,暴露了很多难以克服的问题.为此,Google.Amazo ...
Hadoop生态圈-Zookeeper的工作原理分析
Hadoop生态圈-Zookeeper的工作原理分析作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 无论是是Kafka集群,还是producer和consumer都依赖于Zoo ...
HBase Scan流程分析
HBase Scan流程分析 HBase的读流程目前看来比较复杂,主要由于: HBase的表数据分为多个层次,HRegion->HStore->[HFile,HFile,...,MemSt ...
Redis数据持久化机制AOF原理分析一---转
http://blog.csdn.net/acceptedxukai/article/details/18136903 http://blog.csdn.net/acceptedxukai/artic ...
Hadoop数据管理介绍及原理分析
Hadoop数据管理介绍及原理分析最近2014大数据会议正如火如荼的进行着,Hadoop之父Doug Cutting也被邀参加,我有幸听了他的演讲并获得亲笔签名书一本,发现他竟然是左手写字,当然这个 ...

随机推荐

java比较客户端版本号
参考文章:http://www.jb51.net/article/70317.htm 关键点为什么不能使用String.compareTo方法来比较客户端版本号? 举个例子,之前客户端版本号为:9. ...
android 监控软键盘确定搜索按钮并赋予点击事件
在android的实践开发中,为了界面的美观,往往那些搜索框并没有带搜索按钮,而是调用了软键盘的搜索按钮,完成这次时间 1 2 好吧!直接上代码! <EditText android:id=&q ...
将图片转换为Base64字符串公共类抽取
public class ImageToBase64 { //图片转化成base64字符串 public static String GetImageStr(String path,int width ...
Spark SQL 代码简要阅读（基于Spark 1.1.0）
Spark SQL允许相关的查询如SQL,HiveQL或Scala运行在spark上.其核心组件是一个新的RDD:SchemaRDD,SchemaRDDs由行对象组成,并包含一个描述此行对象的每一列的 ...
用dd命令复制磁盘分区
用dd命令复制磁盘分区首先是复制复制前对写入的分区执行umount操作 sudo dd if=/dev/sda1 of=/dev/sda2 可以在另外一个终端输入这句,然后在原来的dd终端看到进度 ...
数据採集器服务——Socket(今天才发现AES加解密代码跟贴的时候不一样，貌似乱码，不知什么情况)
近期刚做的一个项目.关于 Socket TCP 通信. 需求方提供了一个 ARM 机器,及数据採集器,须要我做一个服务端与数据採集器进行交互. 目的: 数据採集器:定时将读取到的数据发送到服务端. 服 ...
js中字符串转换为数字
js 字符串转化成数字的三种方法主要有转换函数.强制类型转换.利用js变量弱类型转换. 1. 转换函数: js提供了parseInt()和parseFloat()两个转换函数.前者把值转换成整数,后 ...
HTML5 移动端如何使用css让百分比布局的弹窗水平和垂直方向上居中
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
LoadRunner中调用SHA1算法加密字符串
参考<SHA-1 hash for LoadRunner>: http://ptfrontline.wordpress.com/2010/03/02/sha-1-hash-for-load ...
CentOS安装glibc-2.14（转）
到http://ftp.gnu.org/gnu/glibc/下载glibc-2.14.tar.xz tar glibc-2.14.tar.gz cd glibc-2.14 mkdir build cd ...

hbase replication原理分析

hbase replication原理分析的更多相关文章

随机推荐

热门专题