术语表

Flink Application Cluster

Flink应用集群是一个专用的Flink集群,它只执行一个Flink应用的Flink作业。Flink集群的寿命与Flink应用的寿命绑定。

Flink Job Cluster

Flink Job Cluster是一个专用的Flink Cluster,它只执行一个Flink Job。Flink Cluster的寿命与Flink Job的寿命绑定。

Flink Cluster

一个分布式系统由(通常)一个JobManager和一个或多个Flink TaskManager进程组成。

Event

事件是关于应用程序所模拟的域的状态变化的声明。事件可以是流或批处理应用程序的输入和/或输出。事件是特殊类型的记录。

ExecutionGraph

see Physical Graph

Function

函数由用户实现,封装了Flink程序的应用逻辑。大多数Functions都由相应的Operator封装。

Instance

术语instance用于描述运行时特定类型(通常是Operator或Function)的具体实例。由于Apache Flink大部分是用Java编写的,所以对应于Java中的Instance或Object的定义。在Apache Flink的上下文中,并行实例这个术语也经常被用来强调同一个Operator或Function类型的多个实例在并行运行。

Flink Application

Flink应用程序是一个Java应用程序,它从main()方法(或通过其他方式)提交一个或多个Flink作业。提交作业通常是通过调用执行环境上的execute()来完成的。

应用程序的作业可以提交到一个长期运行的Flink会话集群,也可以提交到一个专门的Flink应用集群,或者提交到一个Flink作业集群。

Flink Job

Flink Job是指在Flink应用中通过调用execute()来创建和提交的逻辑图(也常称为数据流图)的运行时表示。

JobGraph

see Logical Graph

Flink JobManager

JobManager是Flink集群的协调器。它包含了三个不同的组件:Flink资源管理器、Flink调度器和每个运行的Flink JobMaster。Flink资源管理器、Flink调度器和每个运行中的Flink JobMaster。

Flink JobMaster

JobMasters是运行在JobManager中的组件之一。一个JobMaster负责监督单个作业的Tasks的执行情况。

Logical Graph

逻辑图是一个有向图,其中节点是操作符,边缘定义了操作符的输入/输出关系,并对应数据流或数据集。逻辑图是通过从Flink应用程序提交作业来创建的。

逻辑图也常被称为数据流图。

Managed State

Managed State描述的是已经在框架中注册的应用状态。对于托管状态,Apache Flink将负责处理持久性和重新缩放等问题。

Operator

逻辑图的节点。操作符执行某种操作,通常由Function执行。源和汇是数据摄入和数据输出的特殊操作符。

Operator Chain

一个操作者链由两个或多个连续的操作者组成,中间没有任何重新分区。同一操作者链内的操作者直接相互转发记录,而不需要经过序列化或Flink的网络栈。

Partition

分区是整个数据流或数据集的一个独立子集。通过将每条记录分配到一个或多个分区,将数据流或数据集划分为多个分区。数据流或数据集的分区在运行时由任务消耗。改变数据流或数据集分区方式的转换通常称为重新分区。

Physical Graph

物理图是翻译逻辑图的结果,以便在分布式运行时执行。节点是任务,边缘表示输入/输出关系或数据流或数据集的分区。

Record

记录是数据集或数据流的组成元素。操作符和函数接收记录作为输入,并发出记录作为输出。

(Runtime) Execution Mode

DataStream API程序可以在两种执行模式中的一种执行:BATCH或STREAMING。BATCH 或 STREAMING。请参阅执行模式了解更多详情。

Flink Session Cluster

一个长期运行的Flink Cluster,它接受多个Flink Job的执行。该Flink Cluster的寿命不受任何Flink Job寿命的约束。以前,Flink Session Cluster也被称为会话模式下的Flink Cluster。与Flink Application Cluster比较。

State Backend

对于流处理程序来说,Flink Job的状态后端决定了它的状态如何存储在每个TaskManager上(TaskManager的Java堆或(嵌入式)RocksDB),以及它在检查点时的写入位置(JobManager的Java堆或Filesystem)。

Sub-Task

子任务是指负责处理数据流的一个分区的任务。术语 "子任务 "强调同一操作员或操作员链有多个并行的Task。

Task

物理图的节点。任务是工作的基本单位,由Flink的运行时执行。任务正好封装了一个操作者或操作者链的一个并行实例。

Flink TaskManager

任务管理器是Flink集群的工作进程。任务被安排给TaskManagers执行。它们相互通信,在后续的Task之间交换数据。

Transformation

变换应用于一个或多个数据流或数据集,并产生一个或多个输出数据流或数据集。变换可能会在每条记录的基础上改变数据流或数据集,但也可能只改变其分区或执行聚合。操作符和函数是Flink的API的 "物理 "部分,而变换只是一个API概念。具体来说,大多数变换是由某些Operator实现的。

Flink-v1.12官方网站翻译-P015-Glossary的更多相关文章

  1. Flink-v1.12官方网站翻译-P005-Learn Flink: Hands-on Training

    学习Flink:实践培训 本次培训的目标和范围 本培训介绍了Apache Flink,包括足够的内容让你开始编写可扩展的流式ETL,分析和事件驱动的应用程序,同时省略了很多(最终重要的)细节.本书的重 ...

  2. Flink-v1.12官方网站翻译-P025-Queryable State Beta

    可查询的状态 注意:可查询状态的客户端API目前处于不断发展的状态,对所提供接口的稳定性不做保证.在即将到来的Flink版本中,客户端的API很可能会有突破性的变化. 简而言之,该功能将Flink的托 ...

  3. Flink-v1.12官方网站翻译-P002-Fraud Detection with the DataStream API

    使用DataStream API进行欺诈检测 Apache Flink提供了一个DataStream API,用于构建强大的.有状态的流式应用.它提供了对状态和时间的精细控制,这使得高级事件驱动系统的 ...

  4. Flink-v1.12官方网站翻译-P008-Streaming Analytics

    流式分析 事件时间和水印 介绍 Flink明确支持三种不同的时间概念. 事件时间:事件发生的时间,由产生(或存储)该事件的设备记录的时间 摄取时间:Flink在摄取事件时记录的时间戳. 处理时间:您的 ...

  5. Flink-v1.12官方网站翻译-P004-Flink Operations Playground

    Flink操作训练场 在各种环境中部署和操作Apache Flink的方法有很多.无论这种多样性如何,Flink集群的基本构件保持不变,类似的操作原则也适用. 在这个操场上,你将学习如何管理和运行Fl ...

  6. Flink-v1.12官方网站翻译-P001-Local Installation

    本地安装 按照以下几个步骤下载最新的稳定版本并开始使用. 第一步:下载 为了能够运行Flink,唯一的要求是安装了一个有效的Java 8或11.你可以通过以下命令检查Java的正确安装. java - ...

  7. Flink-v1.12官方网站翻译-P029-User-Defined Functions

    用户自定义函数 大多数操作都需要用户定义的函数.本节列出了如何指定这些函数的不同方法.我们还涵盖了累加器,它可以用来深入了解您的Flink应用. Lambda函数 在前面的例子中已经看到,所有的操作都 ...

  8. Flink-v1.12官方网站翻译-P028-Custom Serialization for Managed State

    管理状态的自定义序列化 本页面的目标是为需要使用自定义状态序列化的用户提供指导,涵盖了如何提供自定义状态序列化器,以及实现允许状态模式演化的序列化器的指南和最佳实践. 如果你只是简单地使用Flink自 ...

  9. Flink-v1.12官方网站翻译-P027-State Schema Evolution

    状态方案的演变 Apache Flink流媒体应用通常被设计为无限期或长时间运行.与所有长期运行的服务一样,应用程序需要更新以适应不断变化的需求.这对于应用程序所针对的数据模式也是一样的,它们会随着应 ...

随机推荐

  1. wdcp的一个安全漏洞 2015 9 月

    wdcp的一个安全漏洞,非常严重,请大家及时升级和检查 在九月份的时候,wdcp出了一个很严重的安全漏洞,当时也出了补丁更新,具体可看http://www.wdlinux.cn/bbs/thread- ...

  2. 十八般武艺玩转GaussDB(DWS)性能调优:SQL改写

    摘要:本文将系统介绍在GaussDB(DWS)系统中影响性能的坏味道SQL及SQL模式,帮助大家能够从原理层面尽快识别这些坏味道SQL,在调优过程中及时发现问题,进行整改. 数据库的应用中,充斥着坏味 ...

  3. vs code编写java

    不知不觉中vs code变得非常强大了,今天小编就分享一下vs code编写java语言.其实除了java语言,还支持很多语言. 首先看下vs code欢迎页面支持哪些语言: 好家伙,支持的东西还真不 ...

  4. JVM 源码分析(三):深入理解 CAS

    前言 什么是 CAS Java 中的 CAS JVM 中的 CAS 前言 在上一篇文章中,我们完成了源码的编译和调试环境的搭建. 鉴于 CAS 的实现原理比较简单, 然而很多人对它不够了解,所以本篇将 ...

  5. 【JavaWeb】jQuery 基础

    jQuery 基础 介绍 顾名思义,它是 JavaScript 和 查询,是辅助 JavaScript 开发的类库. 它的核心思想是 write less, do more. 所以它实现了很多浏览器的 ...

  6. python学习笔记 | PyCharm创建文件时自动添加头文件

    File Settings Editor File and Code Templates Python Script 然后在右边的框中写入信息就可以啦: # -*- coding: utf-8 -*- ...

  7. UVA - 387 A Puzzling Problem

    题目链接: https://vjudge.net/problem/UVA-387 思路: 非常有意思的拼图,深搜+回溯, 输出硬伤:除了第一次之外,每次先输空格,再输出结果, 以及可能给的数据拼不成4 ...

  8. 树莓派3B装ubuntu server后开启wifi

    树莓派官网选择ubuntu server下载映像 step 1: 使用SDFormatter格式化SD卡: step2: 使用win32diskimager工具将映像写入准备好的SD卡: step3: ...

  9. vue路由切换和用location切换url的区别

    最近的业务涉及到了axios的拦截器,要在request.js里面要根据状态码来跳转页面,这时候我就面对了几种跳转选择: 1.使用location.href='/url'来跳转,简单方便,但是刷新了页 ...

  10. OLE NumberFormat

    设置单元格的数字格式, $3.00 想搞出这样的格式,在VBA里的格式定义如下 $#,##0.00;-$#,##0.00 可是在abap里,就是不行.最后尝试了很多次,原来在在$前面加\变成\$#,# ...