JStorm与Storm源码分析（一）--nimbus-data

Nimbus里定义了一些共享数据结构，比如nimbus-data.
nimbus-data结构里定义了很多公用的数据，请看下面代码:

 (defn nimbus-data [conf inimbus]

   (let [forced-scheduler (.getForcedScheduler inimbus)]

     {:conf conf

      :inimbus inimbus

      :submitted-count (atom 0)

      :storm-cluster-state (cluster/mk-storm-cluster-state conf)

      :submit-lock (Object.)

      :heartbeats-cache (atom {})

      :downloaders (file-cache-map conf)

      :uploaders (file-cache-map conf)

      :uptime (uptime-computer)

      :validator (new-instance (conf NIMBUS-TOPOLOGY-VALIDATOR))

      :timer (mk-timer :kill-fn (fn [t]

                                  (log-error t "Error when processing event")

                                  (halt-process! 20 "Error when processing an event")

                                  ))

      :scheduler (mk-scheduler conf inimbus)

      }))

上述代码中：

submitted-count表示当前已经提交的Topology的数目；
定义了storm-cluster-state对象,该对象可用于将数据存储到ZooKeeper中以及从ZooKeeper读取数据；
submit-lock表示一个锁对象;
定义了downloaders和uploaders缓存；
注:当用户提交Topology时,系统会创建一个上传流并将其放入uploaders缓存中；当Supervisor从Nimbus下载Topology的jar时,系统会创建一个下载流并将其放入downloaders缓存中。任何一种操作完成时，其所对应的上传或下载流就会被关闭，且流所传递的内容也会被从缓存中移除。
uptime定义了当前Nimbus的启动时间;
定义了一个validator，它可用于对Topology进行检测验证.目前使用的是DefaultValidator.
定义了一个timer计时器,并给出了当计数器处理失败时需要调用的方法。
定义了Nimbus所使用的调度器scheduler.

下面我们看一下JStorm中是如何描述nimbus-data的.

在JStorm中定义了一个NimbusData类数据结构来存放数据.NimbusData定义如下：

 public class NimbusData {

     private Map<Object, Object> conf;

     //定义当前已经提交的Topology的数目

     private AtomicInteger submittedCount;

     //定义了cluster-state对象,该对象可用于将数据存储到Zookeeper中以及从Zookeeper读取数据

     private StormClusterState stormClusterState;

     // Map<topologyId, Map<taskid, TkHbCacheTime>>

     private ConcurrentHashMap<String, Map<Integer, TkHbCacheTime>> taskHeartbeatsCache;

     // TODO two kind of value:Channel/BufferFileInputStream

     //定义了downloades和uploaders缓存，当用户提交Topology的时候，系统会创建一个上传流放入uploaders缓存中,

     //而当Supervisor从Nimbus下载Topology的jar包时,系统则会创建一个下载流并将其放入downloaders缓存中。

     //任何一种操作完成时，其所对应的上传或下载流就会被关闭,且流所传递的内容也会被从缓存中移除。

     private TimeCacheMap<Object, Object> downloaders;

     private TimeCacheMap<Object, Object> uploaders;

     // cache thrift response to avoid scan zk too frequently

     private NimbusCache cache;

     private int startTime;

     //定义了Nimbus所使用的调度器

     private final ScheduledExecutorService scheduExec;

     private StatusTransition statusTransition;

     private static final int SCHEDULE_THREAD_NUM = 8;

     private final INimbus inimubs;

     //本地模式

     private final boolean localMode;

     //当前Nimubus的启动时间

     public int uptime() {

         return (TimeUtils.current_time_secs() - startTime);

     }

注：学习李明老师Storm源码分析的笔记。
欢迎关注下面二维码进行技术交流：

JStorm与Storm源码分析（一）--nimbus-data的更多相关文章

JStorm与Storm源码分析（三）--Scheduler，调度器
Scheduler作为Storm的调度器,负责为Topology分配可用资源. Storm提供了IScheduler接口,用户可以通过实现该接口来自定义Scheduler. 其定义如下: public ...
JStorm与Storm源码分析（二）--任务分配，assignment
mk-assignments主要功能就是产生Executor与节点+端口的对应关系,将Executor分配到某个节点的某个端口上,以及进行相应的调度处理.代码注释如下: ;;参数nimbus为nimb ...
JStorm与Storm源码分析（四）--均衡调度器，EvenScheduler
EvenScheduler同DefaultScheduler一样,同样实现了IScheduler接口, 由下面代码可以看出: (ns backtype.storm.scheduler.EvenSche ...
JStorm与Storm源码分析（五）--SpoutOutputCollector与代理模式
本文主要是解析SpoutOutputCollector源码,顺便分析该类中所涉及的设计模式–代理模式. 首先介绍一下Spout输出收集器接口–ISpoutOutputCollector,该接口主要声明 ...
Storm源码分析--Nimbus-data
nimbus-datastorm-core/backtype/storm/nimbus.clj (defn nimbus-data [conf inimbus] (let [forced-schedu ...
storm源码分析之任务分配--task assignment
在"storm源码分析之topology提交过程"一文最后,submitTopologyWithOpts函数调用了mk-assignments函数.该函数的主要功能就是进行topo ...
jQuery1.9.1源码分析--数据缓存Data模块
jQuery1.9.1源码分析--数据缓存Data模块阅读目录 jQuery API中Data的基本使用方法介绍 jQuery.acceptData(elem)源码分析 jQuery.data(el ...
Nimbus<三>Storm源码分析--Nimbus启动过程
Nimbus server, 首先从启动命令开始, 同样是使用storm命令"storm nimbus”来启动看下源码, 此处和上面client不同, jvmtype="-serv ...
storm源码分析之topology提交过程
storm集群上运行的是一个个topology,一个topology是spouts和bolts组成的图.当我们开发完topology程序后将其打成jar包,然后在shell中执行storm jar x ...

随机推荐

python http长连接客户端
背景: 线上机器,需要过滤access日志,发送给另外一个api 期初是单进程,效率太低,改为多进程发送后,查看日志中偶尔会出现异常错误(忘记截图了...) 总之就是端口不够用了报错原因: 每一条日 ...
关于MyEclipse修改项目名称后，部署到tomcat显示旧的项目名称
问题:用Myeclipse部署项目的时候, 出现部署到tomcat下的项目是之前的项目,而不是当前的项目. 解决方案:工程名->右键->Properties->MyEcl ...
JS获取浏览器类型和版本号
JS获取浏览器类型和版本号,增加了IE11的判断. 2015/7/5更新: 简化代码逻辑 var zbrowser = {} var ua = navigator.userAgent.toLowerC ...
Scheme实现二叉查找树及基本操作（添加、删除、并、交）
表转化成平衡二叉树其中有一种分治的思想. (define (list->tree elements) (define (partial-tree elts n) (if (= n 0) (co ...
codeM美团编程大赛初赛B轮D题
[编程题] 模时间限制:1秒空间限制:32768K 给定四个正整数a,b,c,k,回答是否存在一个正整数n,使得a*n在k进制表示下的各位的数值之和模b为c.输入描述:第一行一个整数T(T < ...
怎么用jq封装插件
怎么用jq封装插件以隔行变色为例实现原理:1.找到表格的奇偶行,然后添加不同的class,激活行高亮显示也很简单,只要判断mouseover事件,然后添加一个class,mouseout的时候,再 ...
tomcat7的web.xml的xml片段与注解资源的发现处理逻辑
1.metadata-complete 属性 Servlet 3.0 的部署描述文件 web.xml 的顶层标签 <web-app> 有一个 metadata-complete 属性,该属 ...
Chrome DevTools 调研笔记
1 说明此篇文章针对Chrome DevTools常用功能进行调研分析.描述了每个功能点能实现的功能.应用场景和详细操作. 2 Elements 2.1 功能检查和实时更新页面的HTML与C ...
.NET C#到Java没那么难，MVC篇
最典型的JAVA MVC就是JSP + servlet + javabean的模式.比较好的MVC,老牌的有Struts.Webwork.新兴的MVC 框架有Spring MVC.Tapestry.J ...
关于一点jeesite
最近刚接触jeesite 深深被这个功能强大的框架所折服,虽然其中有一些地方还不完善,但也不妨碍我们通过jeesite提高我们java水平的大门. 这两天在网上一直在找关于jeesite的文章,看来看 ...

JStorm与Storm源码分析（一）--nimbus-data

JStorm与Storm源码分析（一）--nimbus-data的更多相关文章

随机推荐

热门专题