在我的博文《HBase——HMaster启动之一》、《HBase——HMaster启动之二》中已经详细介绍过HMaster在启动过程中调用的各种方法。下面,单就HRegionServer在启动过程中与HMaster的交互做一下深入分析。
首先,让我们来到HRegionServer.run,由于其也是间接实现了Runnable接口。因此,在这里,就从他的run方法开始分析。对于前面的preRegistrationInitialization方法我在这里并不打算讲,因为在我的博文《HBase——HMaster启动之一》中已经详细描述过。这里,就后面的两个方法reportForDuty、handleReportForDutyResponse进行详细描述。

让我们来到reportForDuty方法中。在下图中我已经将其中的重点框选出来。其中的第一个方法是HRegionServer作为与HMaster交互的重点。我在本节将详细讲述。至于第二个方法,相信我在仔细描述第一个方法之后,大家就会感觉清晰明了。首先来到createRegionServerStatusStub方法。由于是长图,所以没有办法编辑,还请大家谅解。

首先,来到masterAddressTracker.getMasterAddress方法。这个MasterAddressTracker在HRegionServer构造时创建并启动,他所监听的ZK上的路径是/hasse/master。refresh为true,这里强制去ZK上查询HMaster的信息。然后调用了rpcClient.createBlockingRpcChannel。这里的rpcClient是在preRegistrationInitialization方法中构造的。

由于在rpcClient.createBlockingRpcChannel方法中仅仅返回了新构造的BlockingRpcChannelImplementation,因此,让我们来到BlockingRpcChannelImplementation的构造方法。这里,我特别标明了BlockingRpcChannel,这个类的完整名称是org.apache.hbase.thirdparty.com.google.protobuf.BlockingRpcChannel。这是由于hbase中将protobuf加入了其第三方包中。其真正类名应该是com.google.protobuf.BlockingRpcChannel。不论如何,他都是PB中的一个接口。这里的BlockingRpcChannelImplementation重写了接口中的callBlockingMethod方法,也就是说,在实际调用的时候,真正调用了rpcClient.callBlockingMethod方法。

接着,我们回到HRegionServer.createRegionServerStatusStub方法中。由上面的那张长图可以看到,由rpcClient.createBlockingRpcChannel返回的对象传入了RegionServerStatusService.newBlockingStub、LockService.newBlockingStub中,构造了这两个service的本地stub。这是PB的基础用法,与HDFS中对于PB的使用方式不用。这里封装的并不是很好。接着,将这两个service赋给HRegionServer的成员变量。
然后,我们就可以回到reportForDuty方法的第二个重点方法this.rssStub.regionServerStartup。这里的rssStub就是刚刚构建的service。其在具体方法调用的时候,正是通过BlockingRpcChannelImplementation中复写的方法来实现的。
也就是说在实际调用rssStub.regionServerStartup,调用到了AbstractRpcClient.callBlockingMethod。关于调用的详细流程,我在博文《hbase之RPC调用流程简介》中有简单介绍,如果大家感觉不是很详细,可以私信我的163邮箱15935152719@163.com。我然后再写一篇博文来详述。这里我们假定这个请求已经发送到了服务端。且服务端的MasterRpcServices.regionServerStartup已经开始调用。
接下来,我们到达HMaster端的MasterRpcServices.regionServerStartup。如下图所示,这里主要调用了ServerManager.regionServerStartup。

让我们继续深入ServerManager.regionServerStartup,由于其只是调用了ServerManager.checkAndRecordNewServer方法,并没有其它重点内容,我在这里就不贴图了。而是来到ServerManager.checkAndRecordNewServer。如下图所示。findServerWithSameHostnamePortWithLock主要是查看当前已注册的RegionServer中是否有同名的ServerName,如果有,则返回ServerName,如果没有,则返回null。然后调用recordNewServerWithLock方法,将其ServerName放入成员变量onlineServers中,也就是说,该RegionServer已经实现了HMaster端的注册。接着调用已注册listeners的serverAdded方法,这些listeners都实现了ServerListener。主要有三个实现ServerListener接口的类:AssignmentManager、RSProcedureDispatcher、DrainingServerTracker。其中DrainingServerTracker是在其start方法中构造的匿名类。

至此,HMaster端实现与HRegionServer的第一次通信。接着,HRegionServer开始调用HRegionServe.handleReportForDutyResponse方法。如下图所示。一开始的for循环是为了将HMaster端返回的部分信息添加到当前的conf成员变量中。紧接着createMyEphemeralNode方法将当前RegionServer的节点信息写入ZK中,路径为/hbase/rs/~。然后调用ZNodeClearer.writeMyEphemeralNodeOnDisk将信息本地化。再然后调用了setupWALAndReplication、startReplicationService两个方法。由于setupWALAndReplication方法比较重要,我将在后面贴图详细介绍。

首先,我们来到setupWALAndReplication方法。在setupWALAndReplication方法中,主要做了两件事情,其一是构造WALFactory,另外一个就是调用createNewReplicationInstance。
在构造WALFactory过程中,主要通过反射了AsyncFSWALProvider并将其封装到SyncReplicationWALProvider中,然后调用其init方法。
在createNewReplicationInstance方法中主要通过反射方法创建了Replication,并调用了其initialize方法。并将新构建的Replication赋给了HRegionServer.replicationSourceHandler与HRegionServer.replicationSinkHandler。由于这里的Replication比较重要,我将在下面详细介绍。

接下来,让我们来到Replication.initialize方法,如下图所示。方法很长,但重点只是构造了ReplicationSourceManager。而在ReplicationSourceManager的构造方法也只是将入参封装,并构建了一个线程池。

接下来,来到handleReportForDutyResponse中第二个重要也是最重要的方法startServices。这个方法很长,几乎所有的RegionServer的服务都是直接或间接通过这个方法启动的。

首先,我们来看initializeThreads。
这里首先构造了MemStoreFlusher。在构造MemStoreFlusher时,值得我们注意的是,实例化了FlushHandler。接下来构实例化了CompactSplit。在构造CompactSplit的过程中,有值得我们关注的地方。下面我们跳过这张图,来到CompactSplit的构造方法。

来到CompactSplit的构造方法以及他在构造方法中主要调用的两个方法。在他的createCompactionExecutors方法中构造了一个StealJobQueue对象。这个类继承自PriorityBlockingQueue,并且内部有一个BlockingQueue类型的stealFromQueue成员变量。然后构建了两个线程池,分别以StealJobQueue、StealJobQueue.stealFromQueue为线程池的工作队列。
接下来构建了一个PressureAwareCompactionThroughputController,并调用了其setup方法。由于其实现了Configurable接口,所以在通过ReflectionUtils.newInstance实例化的时候,调用了其setConf方法。在调用其setup时,实例化并调用了一个ScheduledChore对象,该对象在其复写的chore方法中调用了PressureAwareCompactionThroughputController.tune。

介绍完CompactSplit的实例化后,让我们继续回到HRegionServer.initializeThreads方法中。在方法内,接着构造了CompactionChecker、PeriodicMemStoreFlusher这两个ScheduledChore。接下来构造了Leases(看到这里,你是不是很容易想到HDFS的租约系统LeaseManager)。他扩展了Thread而不是Chore,因为当有事情要做时,睡眠时间可以被中断,而不是Chore睡眠时间是不变的。
紧接着,分别调用MovedRegionsCleaner.create、nonceManager.createCleanupScheduledChore创建了两个ScheduledChore,在二者的chore方法中调用的方法分别是:regionServer.cleanMovedRegions、ServerNonceManager.cleanUpOldNonces。
然后构造了RegionServerRpcQuotaManager与RegionServerSpaceQuotaManager,最后调用了registerConfigurationObservers,将相关的ConfigurationObserver注册到ConfigurationManager中。
介绍完initializeThreads方法后,让我们回到startServices方法。
在startServices方法中接着构建了SecureBulkLoadManager并调用了其start方法。在其start方法中在hadoop上创建了/hbase.rootdir/staging目录。
接着构建了LogRoller,他的作用是定期运行以确定是否应该滚动WAL。同样,他继承了Thread而不是Chore,因为当有事情要做时,睡眠时间可以被中断,而不是Chore睡眠时间是不变的。
然后方法FlushThroughputControllerFactory.create的调用构造了NoLimitThroughputController。
接着构建了RemoteProcedureResultReporter与CompactedHFilesDischarger(继承自ScheduledChore)。
然后呢,就像HMaster在startServiceThreads方法中一样,创建了一大堆有不同用途的线程池,由ExecutorService管理(注:这里的ExecutorService是org.apache.hadoop.hbase.executor.ExecutorService)。
紧接着,调用了walRoller、cacheFlusher、procedureResultReporter线程的start方法。这里简单介绍一下cacheFlusher.start。其中cacheFlusher是我们在initializeThreads方法中构造的,他的类型是MemStoreFlusher,其成员变量flushHandlers在构造期间已经完成初始化。在这里完成了赋值与线程的启动。
再然后,启动了this.leases线程。构造并启动了SplitLogWorker。
最后,分别调用了startHeapMemoryManager、initializeMemStoreChunkCreator。关于initializeMemStoreChunkCreator方法的调用,我在HMaster启动那一节已经介绍过,这里就略过了。需要注意的是在构建ChunkCreator时创建MemStoreChunkPool都注册到了startHeapMemoryManager方法创建的hMemManager,也就是交由hMemManager管理。所以,这里只是介绍startHeapMemoryManager。如下图所示,调用HeapMemoryManager.create创建了HeapMemoryManager。然后调用HeapMemoryManager.start方法创建了HeapMemoryTunerChore并将其加入到ChoreService中调用。值得注意的是,在构建HeapMemoryTunerChore时,其内部的成员变量heapMemTuner类型为DefaultHeapMemoryTuner,并且,这个类实现了Configurable接口。当然他也是通过ReflectionUtils.newInstance方法创建的。

到此为止,我们已经介绍完了上面所有贴图。下面,让我们回到HRegionServer.run方法的后半部分。在这里,已经接近结束了。我只是简单介绍一下。
大家可能对这里的rspmHost很迷惑,这个是什么时候出现的。确实,我之前并没有介绍过,在这里补充一下。在HRegionServer.initializeZooKeeper方法的最后,构建了RegionServerProcedureManagerHost,并将其赋给了成员变量rspmHost。接着,便调用了rspmHost.loadProcedures、rspmHost.initialize。实现了他的初始调用。
来到最后的tryRegionServerReport,HRegionServer正是通过这个方法与HMaster保持心跳。

本节到这里就结束了,大家有什么不懂的地方可以私信我的邮箱15935152719@163.com。如果感觉不错,希望留下你的赞。你的肯定是小编继续前进的动力。
- 全网最详细的HBase启动以后,HMaster进程启动了,几秒钟以后自动关闭问题的解决办法(图文详解)
不多说,直接上干货! 问题详情 情况描述如题所示,hbase启动以后,HMaster进程启动了,几秒钟以后自动关闭,但是HRegionServer进程正常运行: 解决办法: 1.检查下每台机器的时间是 ...
- Hbase HRegionServer启动后自动关闭
突然发现HBASE无法使用了. 然后看到在分布式的情况下,节点上的HRegionServer启动后自动关闭. 同步时间就能解决这个问题. 网上同步时间 1. 安装ntpdate工具 sudo apt ...
- hbase集群部分节点HRegionServer启动后自动关闭的问题
参考链接 http://f.dataguru.cn/thread-209058-1-1.html 我有4HRegionServer节点,1个master,其中3个是unbuntu 系统,2个节点是ce ...
- 重启集群的时候发现HBase的HRegionServer 服务启动失败
今天在测试环境下的集群重启了下,启动Hbase的时候报错: $ sh start-hbase.sh starting master, logging to /home/hadoop/hbase-0.9 ...
- HBase安装和启动
目录 认识HBase 前期准备 1. 解压HBase 2. 修改3个配置文件(配置文件目录:hbase-0.96.2-hadoop2/conf/) 3. 将hadoop的hdfs-site.xml和c ...
- 【原创】大叔问题定位分享(24)hbase standalone方式启动报错
hbase 2.0.2 hbase standalone方式启动报错: 2019-01-17 15:49:08,730 ERROR [Thread-24] master.HMaster: Failed ...
- HBase——HMaster启动之二(HMaster线程的调用)
紧接着上一节HMaster的构建完成.接下来会调用HMaster调用master.start(),master.join(). 由HMaster的继承关系,很明显,他是Runnable的子类.也就是说 ...
- HBase启动后发现HMaster进程消失了
HMaster没起来很多原因,这次看日志是这个.详细请看:http://www.bkjia.com/yjs/982064.html Hbase:namespace异常处理,hbase异常处理 Hbas ...
- 大数据 时间同步问题 解决hbase集群节点HRegionServer启动后自动关闭
1)在hbase-site.xml文件中 修改增加 ,将时间改大点<property><name>hbase.master.maxclockskew</name>& ...
随机推荐
- python-常见用法
一.注释 单行注释:#后全部注释 多行注释:'''所有内容''' 或者使用 """所有内容""" ,多行注释用三对单引号或双引号包裹 二 ...
- redis相关运维命令
1. 查询redis里面的大key? 在redis实例上执行bgsave,然后我们对dump出来的rdb文件进行分析,找到其中的大KEY 有个不太推荐的命令,debug object xxx 可以看到 ...
- gitlab简介与配置
版本控制介绍 版本控制是指对软件开发过程中各种程序代码.配置文件及说明文档等文件变更的管理,是软件配置管理的核心思想之一. 版本控制最主要的功能就是追踪文件的变更.它将什么时候.什么人更改了文件的什么 ...
- mysql 外网访问
--修改用户Root 可以外网访问 update user set host='%' where user='root'; --查询修改结果 select user,host from user; - ...
- ORB-SLAM2阅读笔记(一)从mono_eourc.cpp出发理解ORB-SLAM2
泡泡机器人上已经有公开课ORB-SLAM2的代码详解了,我也先看了一个多小时的视频,后来发现看完还是迷迷糊糊,自己没看源码,根本不明白讲的什么,因此,打开文件开始阅读源码. 为了阅读逻辑清楚,我从OR ...
- INTERVAL YEAR TO MONTH数据类型
INTERVAL YEAR TO MONTH数据类型 Oracle语法: INTERVAL 'integer [- integer]' {YEAR | MONTH} [(precision)][TO ...
- 使用ServletContextListener关闭Redisson连接
ServletContextListener 监听器 在 Servlet API 中有一个 ServletContextListener 接口,它能够监听 ServletContext 对象的生命周 ...
- DataTransfer对象的一些总结
所有元素都支持防止目标事件,但是这些元素默认是不允许释放的,如果拖动元素经过不允许放置的元素无论用户如何操作,都不会触发drop事件,不过可以把任何元素变成有效的放置目标.方法是重写dropenter ...
- easyUI dialog打开对话框,显示列表数据,选取一条数据操作后赋值给父窗口 resultMap声明为全局,生成getset方法
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8" ...
- PageHelper分页+前台BootStrap_pagination样式/BootStrap_table样式
一.PagerHelper分页+前台BootStrap_pagination样式: 效果: 1.引入pageHelper插件:2种方式 pageHelper所需jar包:pagehelper-5 ...