Task Definition

conductor维护工作任务类型的注册表。 必须在工作流中使用之前注册任务类型。

例如:

{
"name": "encode_task",
"retryCount": 3,
"timeoutSeconds": 1200,
"inputKeys": [
"sourceRequestId",
"qcElementType"
],
"outputKeys": [
"state",
"skipped",
"result"
],
"timeoutPolicy": "TIME_OUT_WF",
"retryLogic": "FIXED",
"retryDelaySeconds": 600,
"responseTimeoutSeconds": 3600
}
name: 任务类型,唯一
retryCount: 任务标记为falure时重新尝试的次数
retryLogic:重试机制
timeoutSeconds:时间(以毫秒为单位),之后任务被标记为TIMED_OUT,如果在转入IN_PROGRESS状态后未完成,设为0就没有timeout
timeoutPolicy:任务超时策略
responseTimeoutSeconds:如果大于0,则如果在此时间后未更新状态,则重新调度任务。 当conductor因为错误/网络故障而轮询任务但无法完成时很有用。
outputKeys:任务输出的一组键。 用于记录任务的输出 Retry Logic
  • FIXED : 在 retryDelaySeconds之后重新调度任务
  • EXPONENTIAL_BACKOFF :  retryDelaySeconds * attempNo 之后重新调度任务

Timeout Policy

  • RETRY :再次重试任务
  • TIME_OUT_WF : 工作流程被标记为TIMED_OUT并终止
  • ALERT_ONLY : 注册计数器(task_timeout)

Workflow Definition

工作流程使用基于JSON的DSL进行定义。

Example

{
"name": "encode_and_deploy",
"description": "Encodes a file and deploys to CDN",
"version": 1,
"tasks": [
{
"name": "encode",
"taskReferenceName": "encode",
"type": "SIMPLE",
"inputParameters": {
"fileLocation": "${workflow.input.fileLocation}"
}
},
{
"name": "deploy",
"taskReferenceName": "d1",
"type": "SIMPLE",
"inputParameters": {
"fileLocation": "${encode.output.encodeLocation}"
} }
],
"outputParameters": {
"cdn_url": "${d1.output.location}"
},
"schemaVersion": 2
} name:工作流的名字
description: 工作流的描述性名称
version:用于标识模式版本的数字字段。 使用增长的数字,执行工作流时如果没有指定,就用最高版本
tasks: 一系列任务定义,如下所述。
outputParameters:用于生成工作流输出的JSON模板,如果未指定,则将输出定义为最后一个执行的任务的输出
inputParameters:输入参数列表 用于记录工作流所需的输入,可选的

Tasks within Workflow(工作流内的任务)

工作流中的tasks属性定义了要按该顺序执行的任务数组。 以下是每个任务所需的强制性最低参数:

name:任务名称 在启动工作流之前,必须将其注册为Conductor的任务类型

taskReferenceName:别名用于引用工作流中的任务。 必须是唯一的。

type: 任务类型 SIMPLE用于由远程工作人员执行的任务或系统任务类型之一

optional: true或false(默认为false)。 当设置为true时 - 即使任务失败,工作流仍然继续。 该任务的状态反映为COMPLETED_WITH_ERRORS

inputParameters: JSON模板定义了给定任务的输入

除了这些参数之外,还需要特定于任务类型的附加参数,如文中所述

Wiring Inputs and Outputs

当触发新的执行时,工作流由客户端输入。 工作流输入是一个JSON有效载荷,可通过$ {workflow.input ...}表达式获得。

基于在工作流定义中配置的inputParameters模板,给出工作流中的每个任务的输入。 inputParameters是一个JSON片段,其值包含用于在执行期间从工作流或另一个任务的输入或输出值映射值的参数。
映射值的语法遵循以下模式:
${SOURCE.input/output.JSONPath}
SOURCE:可以是“工作流程”或任何任务的reference name
input/output:指源的输入或输出
JSONPath: JSON路径表达式从源输入/输出中提取JSON片段     http://goessner.net/articles/JsonPath/
conductor支持JSONPath规范,并从这里使用Java实现。
https://github.com/json-path/JsonPath 例如:
考虑一个任务,使用工作流中的输入/输出参数名为loc_task的任务输入配置
{
"inputParameters": {
"movieId": "${workflow.input.movieId}",
"url": "${workflow.input.fileLocation}",
"lang": "${loc_task.output.languages[0]}",
"http_request": {
"method": "POST",
"url": "http://example.com/${loc_task.output.fileId}/encode",
"body": {
"recipe": "${workflow.input.recipe}",
"params": {
"width": 100,
"height": 100
}
},
"headers": {
"Accept": "application/json",
"Content-Type": "application/json"
}
}
}
}
将以下内容作为工作流输入
{
"movieId": "movie_123",
"fileLocation":"s3://moviebucket/file123",
"recipe":"png"
}
而loc_task的输出如下所示;
{
"fileId": "file_xxx_yyy_zzz",
"languages": ["en","ja","es"]
}
在调度任务时,Conductor将合并来自工作流输入和loc_task输出的值,并将其输入到任务中,如下所示:
{
"movieId": "movie_123",
"url": "s3://moviebucket/file123",
"lang": "en",
"http_request": {
"method": "POST",
"url": "http://example.com/file_xxx_yyy_zzz/encode",
"body": {
"recipe": "png",
"params": {
"width": 100,
"height": 100
}
},
"headers": {
"Accept": "application/json",
"Content-Type": "application/json"
}
}
}


conductor元数据定义的更多相关文章

  1. clr 元数据

    clr相关编译器编译生成的托管模块由四部分组成:PE32或32+头.clr头.元数据.IL代码. 元数据和IL代码完全对应,保持一致(:>)性. 元数据有很多用途: VS的智能感知,自动补全: ...

  2. 照片元数据信息以及在照片中写入gps信息

    /// 照片元数据编码 在下面的文章里,可以看到图片所有的元数据定义信息 https://msdn.microsoft.com/zh-cn/library/system.drawing.imaging ...

  3. 【C#进阶系列】02 PE文件,程序集,托管模块,元数据——还是那个Hello world

    好了,还是这张图,还是一样的Hello world. 因为本章其实很多都是讲一些命令行编译啊什么鬼的配置类的东西,要用的时候直接百度或者回头查书就可以了, 所以了解一下也就行了,也没有记录下来,接下来 ...

  4. 使用Atlas进行元数据管理之Atlas简介

    背景:笔者和团队的小伙伴近期在进行数据治理/元数据管理方向的探索, 在接下来的系列文章中, 会陆续与读者们进行分享在此过程中踩过的坑和收获. 元数据管理系列文章: [0] - 使用Atlas进行元数据 ...

  5. 将replicated数据与元数据关联

    本章介绍元数据的用法以及如何将replicated数据与元数据相关联. 12.1概述 将数据从一个表复制到另一个表时,重要的考虑因素是源表和目标表的列结构(元数据)是否相同. Oracle Golde ...

  6. 最齐全的站点元数据meta标签的含义和使用方法

    最齐全的站点元数据meta标签的含义和使用方法 随着HTML5的流行和Web技术的不断演变,Meta标签队伍也越来越壮大,从Windows XP的IE6到现在Windows 7.Windows 8的I ...

  7. MDA模型定义及扩展

    Tiny框架中.对模型本向没有不论什么强制性约束,也就是说你能够把不论什么类型的对象作为模型.也不必实现不论什么接口. 因此简单的说,你定义一个类.里面有一些描写叙述业务属性或处理的内容,就能够说它是 ...

  8. Hive 官方手册翻译 -- Hive DDL(数据定义语言)

    Hive DDL(数据定义语言) Confluence Administrator创建, Janaki Lahorani修改于 2018年9月19日 原文链接 https://cwiki.apache ...

  9. jdbc元数据

    l  在jdbc中获取数据库的定义,例如:数据库.表.列的定义信息.就用到元数据. l  在jdbc中可以使用: 数据库元数据.参数元数据.结果集元数据 l  (元数据定义相关api,  ..Meta ...

随机推荐

  1. 【linux】crontab命令

    一.crond简介 crond是linux下用来周期性的执行某种任务或等待处理某些事件的一个守护进程,与windows下的计划任务类似,当安装完成操作系统后,默认会安装此服务工具,并且会自动启动cro ...

  2. SpringCloud中接收application/json格式的post请求参数并转化为实体类

    @CrossOrigin(allowCredentials="true", allowedHeaders="*", methods={RequestMethod ...

  3. bzoj4693: 雪中送温暖

    Description 每年的1月10日是温暖节,在这一天,化身出题人的C_SUNSHINE将会给OIer们送温暖.OIer们只要在门口放上一个 仙人掌,就能在早上的某个时刻听到门外传来一声:“开门, ...

  4. jenkins的war包下载地址

    https://jenkins.io/doc/book/installing/

  5. 1019 General Palindromic Number (20 分)

    1019 General Palindromic Number (20 分) A number that will be the same when it is written forwards or ...

  6. 解决IE下select标签innerHTML插入option的BUG(兼容

    在ie下面使用innerHTML来插入option选项的话,ie会去掉前面的<option>,并拆分成多个节点,这样会造成select的出错   前言: 这是一个老bug了,现在提供一个完 ...

  7. 6.12-PrepareStatement,JdbcUtil 读取数据库配置文件properties,dao模式

    一.PrepareStatement 防止sql注入 PrepareStatement 是预编译sql语句 更加灵活,更有效率 executeUpdate() 做增删改 executeQuery() ...

  8. 第13章 TCP编程(4)_基于自定义协议的多线程模型

    7. 基于自定义协议的多线程模型 (1)服务端编程 ①主线程负责调用accept与客户端连接 ②当接受客户端连接后,创建子线程来服务客户端,以处理多客户端的并发访问. ③服务端接到的客户端信息后,回显 ...

  9. Spark Standalone模式HA环境搭建

    Spark Standalone模式常见的HA部署方式有两种:基于文件系统的HA和基于ZK的HA 本篇只介绍基于ZK的HA环境搭建: $SPARK_HOME/conf/spark-env.sh 添加S ...

  10. Windows Storage Stack