#研发解决方案#分布式并行计算调度和管理系统Summoner

郑昀创建于2015/11/10 最后更新于2015/11/12

关键词：佣金计算、定时任务、数据抽取、数据清洗、数据计算、Java、Redis、MySQL、Zookeeper、azkaban2、oozie、mesos

提纲：

为什么要做“数据”并行计算调度？
他山之玉：azkaban2/oozie/mesos
Summoner的特性

Summoner 是国玺部门推出的基于 MySQL+Redis+Zookeeper 的分布式并行计算调度和管理系统，李红红主设。

0x00，为什么要做“数据”并行计算调度？

大家都可能做过基于 MySQL 数据库的，大规模的、有步骤的、步骤与步骤之间有依赖关系的数据计算。你可能定义了一堆彼此依赖的定时任务，也可能写成一个大进程跑。

举一个实际场景吧，在我们 O2O 业务体系下，我要做人员规模三四千人、有多条业务线、组织结构为大区-区域-城市-销售组的销售团队的昨日佣金和当月佣金，这里的挑战是：

涉及到商户、门店、交易、折扣、核销物料等等，数据量很大，至少每天都要算一次，要算得快，
激励政策和佣金计算公式随着竞争态势变化，一般一两个月变一次，
数据抽取尽可能少影响正常业务，
计算逻辑调整后要能快速部署和运行。

那么，以前可能会定义一些定时任务，每天凌晨从各个业务数据库（毕竟全都拆库分表了）里抽取：

人员组织架构
大区、区域和城市的对照关系
合同以及合同拥有者
商户和门店
门店下的收单交易
佣金计算公式、规则以及各种权重因子
……

既有全量数据，也有增量数据，所以数据量是很大的。

先算签约数、开店数、交易量等，再把业绩归结在 BD 身上，根据不同业务线的佣金计算公式依次对 BD、BD主管、城市经理等展开各种计算。

虽然我们的 JobCenter 是很优秀的定时任务调度和管理平台，但它没有步骤（即定时任务之间的依赖关系）的概念，所以以前我们只好拍脑袋定 Job1 凌晨1点执行，Job2 凌晨2点执行，Job3和Job4放在3点执行，显然这只是无奈之举，万一 Job1 跑到凌晨3点才算完怎么办？万一 Job1 执行失败了怎么办？

什么是步骤？我们可以用下图来理解一个大计算任务下步骤之间的依赖关系：

图1

为了应对这种数据量很大的抽取和一环套一环的计算，我们需要另行发展一个界面友好的、有步骤概念的、有集群调度的数据计算系统，以充分利用机器资源。

0x01，他山之玉：azkaban2/oozie/mesos

计算资源的调度，好学生有不少，如针对 hadoop 集群调度和管理的 azkaban2 和 oozie，抽象能力更高的分布式资源管理框架 apache mesos。

项目开始之初，我希望借鉴 oozie 和 azkaban2 的一些优秀设计思路，我们其实也是做调度和管理，只不过它们基于 hadoop，我们基于 mysql 而已。

给我深刻印象的调度系统特性有：

计算任务有步骤定义，输入输出都有灵活的定义，适合于数据收集、清洗、聚合、计算等各种常见计算场景；
步骤可以通过依赖关系来定义串行还是并行；
可以很直观地看到当前任务执行时跑到了哪一个步骤，或者哪些计算小任务；

如 oozie 的界面

可以很直观地收集和展示当前任务里的输出流以及异常日志流；
可以很方便地暂停、终止、重启任务，无需担心遗留垃圾中间数据；
有报警机制，有一些简单指标展示；
计算任务的步骤定义视觉化

如 azkaban2 的界面

于是，国玺李红红他们开始动手设计。最终出来的效果还不错，下面介绍一下。

后来我们的容器私有云用了 apache mesos，我觉得 mesos 这种高度抽象的资源调度和管理系统非常适合我们的数据并行计算应用场景，于是假想了一番：我们写调度器去和 mesos 通信，告诉它要去执行什么命令，它去负责在整个 cluster 里调度；我们写的工程以及控制台有点儿像 marathon，依托于 mesos+chronos；我们写的从不同数据源抽取原始数据、计算佣金的代码，打成 jar 包后放在 mesos master 上，配置好后，mesos slave 真的接到调度指令去运行时，会自己从 master 节点下载 jar 包并执行，blabla……这样 mesos 能替我们省了不少开发工作。

0x02，Summoner的特性

下面介绍一下我们针对数据计算的分布式并行计算调度系统——Summoner（魔法师）。

我们命名一个大计算任务为『工作流』，工作流下有多个任务，任务彼此之间可以可视化地建立依赖关系。

工作流可以设定 Quartz cron 表示式从而定期执行，可以直观地看到任务执行的进度，执行日志、异常日志，状态。

我们还可以复用任务，一个任务可以隶属于多个工作流。这样当佣金计算规则变化时，我们只需要复用一部分任务，新增一些任务，另建一个新工作流把任务串起来即可，同时把原来的工作流禁用，这样进退自如。

负责执行任务的客户端（jar包）能够自动注册（通过 Zookeeper），于是系统知道现在有多少个机器节点可以执行某一个任务。

于是，假如任务B有了10个客户端注册，任务A抽取了一千万条交易记录，系统将这批记录分拆为十份，发给10个任务B客户端，于是任务B将在多个机器节点上并行计算，然后系统再去调度任务C。

它的菜单功能有：

资源配置管理

工作流管理
任务管理
依赖关系管理
注册管理（客户端注册和服务器端注册）

任务调度管理

调度管理

实时数据管理

工作流执行情况

调度日志管理

调度日志

下面是首页工作台，我们可以看到自己帐号下有多少个工作流执行完成/失败/暂停执行/取消执行，以及系统报警和信息的通知。

图2 summoner首页工作台

首先，我们需要建立工作流：

图3 资源配置管理-工作流管理

我们还要把任务建起来，任务真正的执行者是一个 Java 实现的任务处理类：

图4 任务管理

图5 编辑任务

其次，我们要任务之间的依赖关系建立起来：

图6 依赖关系管理

然后管理工作流：

图7 工作流图管理

我们可以让工作流立即执行，来观察它的进度：

图8 调度日志管理

以及每一个任务的进度：

图9 工作流执行详情

集群里不同节点都可能会卷入工作流执行，它们产生的日志会被 flume 聚合，之后在平台上实时展示：

图10 工作流执行日志

图11 客户端注册

图12 服务器端注册

图13 系统通知

Summoner 是 JobCenter 的延伸和有益补充，它们各自有各自的应用场景。我们还会借鉴 mesos 的先进理念，进一步提升 Summoner 的集群调度能力。

-EOF-

20160108注：2015年年底也看到了当当网对它的“分布式任务调度框架：当当elastic-job开源项目的10项特性”做了阐述，有一些理念相似，如任务分片，分布式，值得我们进一步学习。

欢迎阅读我的其他电商文章：

欢迎订阅我的微信订阅号『老兵笔记』，请扫描二维码关注：

#研发解决方案#分布式并行计算调度和管理系统Summoner的更多相关文章

#研发解决方案介绍#Tracing（鹰眼）
郑昀最后更新于2014/11/12 关键词:GoogleDapper.分布式跟踪.鹰眼.Tracing.HBase.HDFS. 本文档适用人员:研发分布式系统为什么需要 Tracing? ...
#研发解决方案介绍#IdCenter（内部统一认证系统）
郑昀基于朱传志的设计文档最后更新于2014/11/13 关键词:LDAP.认证.权限分配.IdCenter. 本文档适用人员:研发曾经一个IT内部系统配一套帐号体系和授权线上生产环境里 ...
#研发解决方案介绍#基于StatsD+Graphite的智能监控解决方案
郑昀基于李丹和刘奎的文档创建于2014/12/5 关键词:监控.dashboard.PHP.graphite.statsd.whisper.carbon.grafana.influxdb.Pyth ...
#研发解决方案介绍#基于ES的搜索+筛选+排序解决方案
郑昀基于胡耀华和王超的设计文档最后更新于2014/12/3 关键词:ElasticSearch.Lucene.solr.搜索.facet.高可用.可伸缩.mongodb.SearchHub.商品中 ...
#研发解决方案介绍#Recsys-Evaluate（推荐评测）
郑昀基于刘金鑫文档最后更新于2014/12/1 关键词:recsys.推荐评测.Evaluation of Recommender System.piwik.flume.kafka.storm.r ...
利用 MessageRPC 和 ShareMemory 来实现分布式并行计算
可以利用 MessageRPC + ShareMemory 来实现分布式并行计算 . MessageRPC : https://www.cnblogs.com/KSongKing/p/945541 ...
分布式开源调度框架TBSchedule原理与应用
主要内容: 第一部分 TBSchedule基本概念及原理 1. 概念介绍 2. 工作原理 3. 源代码分析 4. 与其它开源调度框架对照第二部分 TBSchedule分布式调度演示样例 1. TBS ...
JAVA系统架构高并发解决方案分布式缓存分布式事务解决方案
JAVA系统架构高并发解决方案分布式缓存分布式事务解决方案
#研发解决方案#discache-分布式缓存查询与管理系统
郑昀基于马海元和闫小波的文档关键词:memcached.redis.分布式缓存.控制台.反序列化.Java 本文档适用人员:研发和运维员工提纲: 如何查看缓存里的序列化数据? 批量删除来一个监 ...

随机推荐

The difference between QA, QC, and Test Engineering
Tuesday, March 06, 2007 Posted by Allen Hutchison, Engineering Manager and Jay Han, Software Enginee ...
MySql的一些用法
1.怎样找到MySql数据的存储目录? 答:从服务中查看正在运行的MySql,查看它的启动参数,可能是这个样子: "D:\Program Files\MySQL\MySQL Server 5 ...
Session的属性
Session的属性 Session在网络应用中被称为会话.具体到web中的Session指的就是用户在浏览某个网站时,从进入网站到浏览器关闭所经过的这段时间,也就是用户浏览这个网站所花费的时间,因 ...
[Sass]占位符 %placeholder
[Sass]占位符 %placeholder Sass 中的占位符 %placeholder 功能是一个很强大,很实用的一个功能,这也是我非常喜欢的功能.他可以取代以前 CSS 中的基类造成的代码冗余 ...
javaSE基础04
javaSE基础04 一.三木运算符 <表达式1> ? <表达式2> : <表达式3> "?"运算符的含义是: 先求表达式1的值, 如果为真, ...
深入理解Web标准（网站标准）
深入理解Web标准(网站标准) 我觉得一名Web前端应该好好理解Web标准到底是什么,为什么要在我们的实际实践中遵循Web标准. 什么是Web标准.百度百科的解释是: WEB标准不是某一个标准,而 ...
python中的反射
在绝大多数语言中,都有反射机制的存在.从作用上来讲,反射是为了增加程序的动态描述能力.通俗一些,就是可以让用户参与代码执行的决定权.在程序编写的时候,我们会写很多类,类中又有自己的函数,对象等等.这些 ...
SQL Server 系统数据库
Sql Server的系统数据库分为:master.model.msdb,resouce和tempdb,这五个数据库在SQL Server中各司其职,作为研发人员,很有必要了解这几个数据库的职责,下面 ...
Oracle SqlDeveloper创建JOB
步骤1: 步骤2: 步骤3:
XMLFeedSpider例子
from scrapy import log from scrapy.contrib.spiders import XMLFeedSpider from myproject.items import ...

#研发解决方案#分布式并行计算调度和管理系统Summoner

#研发解决方案#分布式并行计算调度和管理系统Summoner的更多相关文章

随机推荐

热门专题