近日,Apache SeaTunnel 正式发布 2.3.2 版本。此时距离上一版本 2.3.1 发布已有两个多月,期间我们收集并根据用户和开发者的反馈,在 2.3.2 版本中对 SeaTunnel Zeta Engine 进行了 Bug 修复,提高了引擎的稳定性和使用效率。

此外,新版本还对 Connector-V2 中的连接器进行了功能和性能优化,同时 SQL Transfrom 支持了自定义 UDF 函数,Zeta Engine 也提供了通过 Rest API 的方式进行集群的监控和查询操作。

本文将为大家介绍 Apache SeaTunnel 2.3.2 版本更新内容具体情况。

新功能

本次更新,Zeta Engine 支持了以 RestAPI 的方式获取任务和系统的监控信息,用户可以通过调用 HTTP 请求到任意节点完成数据信息请求,增强了任务的监控能力。

详情可参考:https://seatunnel.apache.org/docs/2.3.2/seatunnel-engine/rest-api

此外,2.3.2 版本中 SQL Transform 支持了自定义 UDF 函数,详细用法请参考:https://seatunnel.apache.org/docs/2.3.2/transform-v2/sql-udf

Core

[Core] [API] 支持将字符串转换为List选项 (#4362)

[Core] [API] 在创建源、接收器和转换之前添加选项检查到FactoryUtil中 (#4424)

[Core] [Shade] 添加guava shade模块 (#4358)

Connector-V2

  • [Connector-V2] [CDC] [SQLServer] 支持多表读取 (#4377)
  • [Connector-V2] [Kafka] Kafka源支持跳过数据反序列化失败 (#4364)
  • [Connector-V2] [Jdbc] [TiDB] 添加了TiDB目录 (#4438)
  • [Connector-V2] [File] 添加了文件Excel的源和接收器 (#4164)
  • [Transform-V2] 添加了UDF SPI和一个示例实现,用于SQL转换插件 (#4392)
  • [Transform-V2] 支持复制字段列表 (#4404)
  • [Transform-V2] 为FieldMapperTransform添加了CatalogTable支持 (#4423)
  • [Transform-V2] 为ReplaceTransform添加了CatalogTable支持 (#4411)
  • [Transform-V2] 为FilterRowKindTransform添加了Catalog支持 (#4420)
  • [Transform-V2] 为FilterFieldTransform添加了CatalogTable支持 (#4422)

Zeta Engine

  • [Zeta] 支持Factory和Plugin SPI的混合使用 (#4359)
  • [Zeta] 添加了通过作业ID获取运行中作业信息的REST API (#4140)
  • [Zeta] 添加了获取系统监控信息的REST API (#4315)
  • [Transform V2 & Zeta] 使SplitTransform支持CatalogTable和CatalogTable演化 (#4396)

改进

Apache SeaTunnel 2.3.2 版本对 Zeta 引擎进行了稳定性修复,解决了内存占用过高不释放的问题,同时解决了大量资源占用问题,对性能也做了相应的优化。

Core

  • [Core] [Spark] 将转换操作从Spark Driver推送到Executors (#4503)
  • [Core] [Starter] 优化代码结构,删除冗余代码 (#4525)
  • [Core] [Translation] [Flink] 优化代码结构,删除冗余代码 (#4527)

Connector-V2

  • [Connector-V2] [CDC] 改进startup.mode/stop.mode选项 (#4360)
  • [Connector-V2] [CDC] 优化jdbc fetch-size选项 (#4352)
  • [Connector-V2] [SQLServer] 修复了SQL Server目录的问题 (#4441)
  • [Connector-V2] [StarRocks] 改进StarRocks序列化错误消息 (#4458)
  • [Connector-V2] [Jdbc] 添加了SQL日志,并更新了一些样式 (#4475)
  • [Connector-V2] [Jdbc] 修复了多个表时无法自动获取表名的问题 (#4514)
  • [Connector-V2] [S3 & Kafka] 删除不可用的S3和Kafka目录 (#4477)
  • [Connector-V2] [Pulsar] 支持Canal格式

Zeta Engine

  • [Zeta] 支持通过守护进程模式运行服务器 (#4161)
  • [Zeta] 使用ClassLoader改进客户端的SDK兼容性 (#4447)
  • [Zeta] 客户端支持异步提交作业 (#4456)
  • [Zeta] 增加更详细的日志输出 (#4446)
  • [Zeta] 改进seatunnel-cluster.sh脚本 (#4435)
  • [Zeta] 当任务未准备好时,降低CPU消耗 (#4479)
  • [Zeta] 添加解析器日志 (#4485)
  • [Zeta] 删除冗余代码 (#4489)
  • [Zeta] 在validateSQL中删除冗余代码 (#4506)
  • [Zeta] 改进JobMetrics的性能 (#4467)

Bug修复

Core

*[Core] [API] 修复了列表的通用类丢失的问题 (#4421)

*[Core] [API] 修复了解析嵌套行数据类型键变为大写的问题 (#4459)

Connector-V2

  • [Json-format] [Canal-Json] 修复了JSON反序列化时的空指针异常问题 (#4195)
  • [Connector-V2] [Jdbc] 修复了在JDBC源查询中不支持字段别名的问题 (#4210)
  • [Connector-V2] [Jdbc] 修复了连接超时导致连接失败的问题 (#4322)
  • [Connector-V2] [Jdbc] 将JdbcOption: generate_sink_sql的默认值设置为false (#4471)
  • [Connector-V2] [Pulsar] 修复了无法持续消费消息的问题 (#4125)
  • [Connector-V2] [Eleasticsearch] 修复了文档描述错误的问题 (#4390)
  • [Connector-V2] [Eleasticsearch] 修复了源反序列化错误和不适当的问题 (#4233)
  • [Connector-V2] [Kafka] 修复了KafkaProducer资源从未被释放的问题 (#4302)
  • [Connector-V2] [Kafka] 修复了client.id导致权限问题的问题 (#4246)
  • [Connector-V2] [Kafka] 修复了提交偏移错误导致KafkaConsumerThread退出的问题 (#4379)

Zeta Engine

  • [Zeta] 修复了LogicalDagGeneratorTest测试用例的问题 (#4401)
  • [Zeta] 修复了MultipleTableJobConfigParser仅解析一个转换的问题 (#4412)
  • [Zeta] 修复了缺少common插件jar包的问题 (#4448)
  • [Zeta] 修复了在检查点已完成时仍调用handleCheckpointError的问题 (#4442)
  • [Zeta] 修复了作业错误消息不正确的bug (#4463)
  • [Zeta] 修复了查找TaskGroup部署节点的bug (#4449)
  • [Zeta] 修复了配置文件的bug (#4488)
  • [Zeta] 修复了从zeta加载连接器的逻辑问题 (#4510)
  • [Zeta] 修复了hadoop-hdfs的冲突依赖问题 (#4509)

E2E

*[E2E] [Kafka] 修复了Kafka端到端测试用例的问题 (#4520)

*[Container Version] 修复了无法重现的测试用例风险问题 #4591

文档优化

  • [Docs] 优化了Doris和SelectDB连接器文档的部分内容 (#4365)
  • [Docs] 修复了文档中的代码样式问题 (#4368)
  • [Docs] 更新了jdbc文档和kafka文档 (#4380)
  • [Docs] 修复了max_retries默认值为0的问题 (#4383)
  • [Docs] 修复了Markdown语法问题 (#4426)
  • [Docs] 修复了Kafka文档错误的配置键 "kafka." (#4427)
  • [Docs] 添加了快速入门v2中的Transform部分 (#4436)

贡献者名单

感谢白鲸开源工程师 范佳 对本次版本发布的支持,以及以下社区小伙伴的贡献!

Andrew Wetmore,

Bibo,

Carl-Zhou-CN,

Cason-ACE,

Chengyu Yan,

CodingGPT,

dalong,

Eric,

FlechazoW,

Guangdong Liu,

Hao Xu,

J.A.R.V.I.S,

Kim,

Laglangyue,

Marvin,

TaoZex,

Tyrantlucifer,

Xiaojian Sun,

ZhilinLi,

Zongwen Li,

dylandai,

gnehil,

hailin0,

ic4y,

kezhenxu94,

lightzhao,

lucklilili,

lvshaokang,

mengxiaopeng,

monster,

songjianet,

stdnt-xiao,

thomasc,

will27,

wyc,

xiaofan2012,

zhilinli,

本文由 白鲸开源 提供发布支持!

SeaTunnel 发布成为 Apache 顶级项目后首个版本 2.3.2,进一步提高 Zeta 引擎稳定性和易用性的更多相关文章

  1. Dubbo下一站:Apache顶级项目

    导读: 近日,在Apache Dubbo开发者沙龙杭州站的活动中,阿里巴巴中间件技术专家曹胜利(展图)向开发者们分享了Dubbo2.7版本的规划. 本文将为你探秘 Dubbo 2.7背后的思考和实现方 ...

  2. 盘点 35 个 Apache 顶级项目,我拜服了…

    Apache 软件基金会 Apache 软件基金会,全称:Apache Software Foundation,简称:ASF,成立于 1999 年 7 月,是目前世界上最大的最受欢迎的开源软件基金会, ...

  3. 我给 Apache 顶级项目提了个 Bug

    这篇文章记录了给 Apache 顶级项目 - 分库分表中间件 ShardingSphere 提交 Bug 的历程. 说实话,这是一次比较曲折的 Bug 跟踪之旅.10月28日,我们在 GitHub 上 ...

  4. Eclipse创建Maven Web项目后更改Servlet版本

    Eclipse创建Maven Web项目后更改Servlet版本 1.场景基于Eclipse通过maven-archetype-webapp原型创建一个Web项目后,其默认Servlet版本是2.3, ...

  5. Apache 顶级项目 Apache Pulsar 成长回顾

    关于 Apache Pulsar Apache Pulsar 是 Apache 软件基金会顶级项目,是下一代云原生分布式消息流平台,集消息.存储.轻量化函数式计算为一体,采用计算与存储分离架构设计,支 ...

  6. 特性预览:Apache 顶级项目 Apache Pulsar 2.6.1 版本

    在正式分享 2.6.1 版本更新细节之前,冉小龙首先为我们分享了两个相关 PIP 的内容. 一个是 PIP-47 中关于「基于时间来进行版本更新」的计划.该 PIP 提出后,从 2.5.0 版本到目前 ...

  7. 我给Apache顶级项目贡献了点源码。

    这是why技术的第 91 篇原创文章 这篇文章其实并没有什么技术性的分享,从我的角度而言,更多是记录和思考. 把我对于源码和之前写的部分文章反哺给我的一些东西,带来的一点点思考分享给大家. 一行源码 ...

  8. Apache顶级项目 Calcite使用介绍

    什么是Calcite Apache Calcite是一个动态数据管理框架,它具备很多典型数据库管理系统的功能,比如SQL解析.SQL校验.SQL查询优化.SQL生成以及数据连接查询等,但是又省略了一些 ...

  9. eclipse导入别的项目后发现jdk版本不一样,该如何解决呢?

    当我们导入其他人的项目的时候,发现导入的项目的jdk版本与我们使用电脑上的版本不同,该如何解决呢? 选中项目右键 --> Properties --> Build Path --> ...

  10. 官宣!DolphinScheduler 毕业成为 Apache 软件基金会顶级项目

    全球最大的开源软件基金会 Apache 软件基金会(以下简称 Apache)于北京时间 2021年4月9日在官方渠道宣布Apache DolphinScheduler 毕业成为Apache顶级项目.这 ...

随机推荐

  1. java和javac编译和运行记事本编写的代码

    演示代码如下: package com.springboot.demo; public class Hello { public static void main(String[] args) { S ...

  2. 阿里云安全扫描漏洞修复fastjson,jackson,xstream,redis, 微信支付xml转对象 ForbiddenClassException

    阿里云安全扫描漏洞修复fastjson,jackson,xstream,redis 1.fastjson漏洞fastjson爆发新的反序列化远程代码执行漏洞,黑客利用漏洞,可绕过autoType限制, ...

  3. 制作tomcat镜像

    本篇文章介绍用Dockerfile的方式构建Tomcat镜像,请保证安装了Docker环境. 首先创建/opt/tomcat目录,后续步骤都在该目录下进行操作. 准备好Jdk和Tomcat安装文件,放 ...

  4. python selenium.remote远程连接时间达10分钟

    问题: 在机器A搭建了selenium-grid的环境,hub以4444端口号启动,并在4444下注册了子node,端口4445,浏览器配置chrome 使用代码进行远程连接,并创建会话: 传入的se ...

  5. 高通lk:配置与使用i2c

    高通lk:配置与使用i2c 以msm8909为例. 背景 在lk中要去驱动一个aw9523的ic来控制指示灯. 但是现在对应的i2c没有打开.因此需要进行处理. 步骤 找到I2C对应的ID与句柄 参考 ...

  6. Linux中的IDR机制

    # Linux中的IDR机制 背景 最近在学习 Linux的i2c子系统,看到代码中有关于IDR的调用.了解了一下有关的文档,发现是用来管理指针(对象实例). //based on linux V3. ...

  7. 使用kk在centos7上离线部署kubesphere v3.0.0详解

    环境准备 以三台centos 7.7 64bit 为例: 确保所有机器已经安装所需依赖软件(sudo curl openssl ebtables socat ipset conntrack docke ...

  8. 3568F-Linux应用开发手册

       

  9. 如何让 3D 数字孪生场景闪闪发光

    今日图扑软件功能分享:我们将探讨 HT 系统如何通过分组管理灯光.裁切体和流光,以提高场景光影效果的精准度和整体可控性. HT 中的灯光.裁切体.流光是会影响它所在区域一定范围内的其他节点的表现,如 ...

  10. oeasy教您玩转vim - 51 - # 读写文件

    读写文件 回忆上节课内容 命令行的光标控制 方向键️️️️️可以控制左右移动 shift+️️️️️按照word左右移动光标 ctrl+b 到开头begin ctrl+e 到结尾end ctrl+w ...