Apache SeaTunnel 4月回顾:明星贡献者与技术突破
各位热爱 SeaTunnel 的小伙伴们,SeaTunnel 社区 4 月份月报来啦!这里将记录 SeaTunnel 社区每月的重要更新,欢迎关注!
月度 Merge 之星
感谢以下小伙伴 4 月为 Apache SeaTunnel 做的精彩贡献(排名不分先后):
@TyrantLucifer,@sunxiaojian,@CosmosNi,@corgy-w,@litiliu,@LeonYoah,@hailin0,@taohaozhi1129,@L-Gryps,@Hisoka-X,@xiaochen-zhou,@shangeyao,@lightzhao,@haneeshmv,@liunaijie,@nianhua99,@dailai,@dzygoon,@ruanwenjun,@xxzuo,@liugddx,@EricJoy2048,@baicie,@YalikWang,@gitfortian
apache/seatunnel
fix
- [fix][doc]修复死链 @liunaijie
- [fix][zeta]修复无法释放资源的问题 @liunaijie
- [Fix]修复Oracle类型转换器在数值类型中处理负数比例的问题 @Hisoka-X
- [Bug Fix]将Doris的错误状态(#6753)记录下来。 @taohaozhi1129
- [bigfix][S3 File]:Change the [SCHEMA] attribute of the [S3CONF class]为了在反序列化后避免重新赋值,需要使其非静态 @LeonYoah
- [Hotfix][S3 Connector]将aws-java-sdk-bundle的版本更新以修复任务无法运行的问题。 @EricJoy2048
- [Fix][Script]修复 JVM 选项文件末尾没有
\n
时丢失 JVM 选项的问题 @Hisoka-X - [fix]修复SeaTunnel获取row size时的NPE问题 @liunaijie
- [Fix][Connector-v2]修复 Doris 和 StarRocks 数据库中创建表的 SQL 语句错误 @dailai
- [Fix][Doc]修复了一些文档中的链接 @xxzuo
- [Fix][connector-rocketmq]将正确的偏移量提交给broker,并减少ThreadInterruptedException日志 @YalikWang
- [Fix][Kafka-Sink]修复Apache SeaTunnel KafkaSinkFactory选项规则 @liunaijie
- [Fix][Doc]修复一些拼写错误 @xiaochen-zhou
- [Fix][Doc]修复FTPSink配置键
username
为user
。 @Hisoka-X - [fix][connector-rocketmq]修复了当checkpoint.interval设置过小时引发的空指针异常问题(#6624) @YalikWang
- [Hotfix]修复了Apache SeaTunnel中HTTP源读取yyyy-MM-dd HH:mm:ss格式数据的bug,并优化了DateTimeUtils。 @EricJoy2048
- [Bug] [formats]修复当内容包含文件分隔符时解析行失败的问题 @litiliu
- [Fix][Connector-V2]修复当分区已存在时,Apache SeaTunnel增加Hive分区的错误 @Hisoka-X
- [Fix][Zeta]解决因保存点检查机制导致的线程挂起问题 @Hisoka-X
- [Bug]修复OrcWriteStrategy/ParquetWriteStrategy在使用Kerberos身份验证时的登录问题。 @ruanwenjun
- [Bug][Improve][Connector-v2][ElasticsearchSource]修复当源为空时的行为,支持SourceConfig.SOURCE字段为空。 @CosmosNi
- [Hotfix]解决 DEFAULT TABLE 问题 @EricJoy2048
improve
- [Improve][Zeta]为Zeta任务添加Minio作为检查点存储的文档 @gitfortian
- [Improve] [Clickhouse]当设置allow_experimental_lightweight_delete为false时,移除检查 (#6727) @shangeyao
- [Improve][HiveSink]修复资源泄漏的风险。 @lightzhao
- [Improve][Zeta]禁用Apache SeaTunnel检查点的HDFS文件系统缓存。 @LeonYoah
- [Doc][Improvement]为Config-Encryption-Decryption.md添加中文支持 @xxzuo
- [Doc][Improve]介绍文档中的多行文本功能 @nianhua99
- [Feature][connector-v2]启用了Iceberg-sink模式变更测试 @sunxiaojian
- [Improve][mysql-cdc/jdbc]支持MySQL 5.5版本 @hailin0
- [Improve]优化CDC连接器中的表架构读取 @Hisoka-X
- [Improve][mysql-cdc]当
SHOW CREATE TABLE
命令失败时,回退到描述表 @hailin0 - [Improve][Hive]更新Hive 3版本 @EricJoy2048
- [Feature][Connector-V2]冰山sink支持将数据写入分支 @sunxiaojian
- [Improve][Transform]移除找不到字段异常 @xiaochen-zhou
- [Feature][Zeta]在作业配置中支持配置任务重试次数。 @Hisoka-X
- [Improve]优化Doris流加载客户端侧的错误信息 @Hisoka-X
- [Improve]优化Parquet类型转换时的读取性能 @Hisoka-X
- [Improve][Zeta]当任务完成后,检查点将不会写入文件。 @liunaijie
- [Improve][Jdbc]在SQL中添加引号标识符 @hailin0
- [Improve][Zeta]优化RestHttpGetCommandProcessor#getSeaTunnelServer()方法的逻辑 @xiaochen-zhou
- [Doc][Improve]Sink部分支持中文 @corgy-w
- [Doc][Improve]为Kafka连接器添加Kerberos身份验证支持 (#6653) @gitfortian
- [Doc][Improve]为seatunnel-engine添加中文支持 @xxzuo
- [Improve][Connector-v2]Hive连接器支持多个文件系统。 @dailai
- [Improve][Transform]移除解析转换过程中的Fallback @xiaochen-zhou
- [Feature][Tool]为问题6199添加连接器检查脚本 @dailai
- [Feature][CDC]在cdc数据源中支持监听消息延迟事件。 @hailin0
- [Improve][Test]修复
ResourceManager
和EventReport
模块上测试的不稳定问题。 @Hisoka-X - [Improve][Jdbc]在自动创建表时增加类型转换器 @hailin0
- [Improve][Connector-V2]支持PaimonSink的Hadoop HA和Kerberos认证。 @dailai
- [Improve][CDC]当记录不包含模式字段时,提升读取性能。 @Hisoka-X
- [feature][connector-v2]添加xugudb连接器 @L-Gryps
- [Improve][CDC]在增量阶段优化split状态的内存分配 @hailin0
- [Improve][Zeta][storage]更新HDFS配置,支持更多参数 @liunaijie
- [Doc][Improve]为start-v2/locally/quick-start-flink.md和start-v2/locally/quick-start-spark.md添加中文支持。 @dzygoon
- [Feature][starter]支持在Spark/Flink引擎上用户自定义参数。 @liunaijie
- [Feature]Hive源/ sink支持多个表。 @ruanwenjun
others
- [Chore]删除无用的接口 @TyrantLucifer
- 2.3.5版本发布 @liugddx
- [Release][2.3.5][release-note]添加发布说明 @liugddx
- [Docs]更新Debezium JSON文档 @liunaijie
- [E2E]修复Amazon DynamoDB IT的不稳定问题 @hailin0
- [Docs]修复Kafka格式文档 @liunaijie
- [E2E]启用StarRocksCDCSinkIT @liunaijie
apache/seatunnel-website
- [Docs]更新并支持选择语言 @baicie
apache/seatunnel-web
- [feature][datasource]主要添加数据源-jdbc-db2 @haneeshmv
本文由 白鲸开源 提供发布支持!
Apache SeaTunnel 4月回顾:明星贡献者与技术突破的更多相关文章
- Apache SeaTunnel (Incubating) 2.1.0 发布,内核重构、全面支持 Flink
2021 年 12 月 9 日,SeaTunnel (原名 Waterdrop) 成功加入 Apache 孵化器,进入孵化器后,SeaTunnel 社区花费了大量时间来梳理整个项目的外部依赖以确保整个 ...
- 陈胡:Apache SeaTunnel实现 非CDC数据抽取实践
导读: 随着全球数据量的不断增长,越来越多的业务需要支撑高并发.高可用.可扩展.以及海量的数据存储,在这种情况下,适应各种场景的数据存储技术也不断的产生和发展.与此同时,各种数据库之间的同步与转化的需 ...
- 7月19日Docker&Kubernetes技术沙龙总结 - DockOne.io
7月19日Docker&Kubernetes技术沙龙总结 - DockOne.io undefined
- Apache web服务器(LAMP架构)(week3_day4)--技术流ken
apache介绍 1).世界上使用率最高的网站服务器,最高时可达70%:官方网站:apache.org 2).http 超文本协议 HTML 超文本标记语言 3).URL 统一资源定位符 http:/ ...
- 🏆【Alibaba微服务技术系列】「Dubbo3.0技术专题」回顾Dubbo2.x的技术原理和功能实现及源码分析(温故而知新)
RPC服务 什么叫RPC? RPC[Remote Procedure Call]是指远程过程调用,是一种进程间通信方式,他是一种技术的思想,而不是规范.它允许程序调用另一个地址空间(通常是共享网络的另 ...
- 倒计时0日!Apache DolphineScheduler4月 Meetup 大佬手把手教你大数据开发,离线调度
随着互联网技术和信息技术的发展,信息的数据化产生了许多无法用常规工具量化.处理和捕捉的数字信息.面对多元的数据类型,海量的信息价值,如何有效地对大数据进行挖掘分析,对大数据工作流进行调度,是保障企业大 ...
- 中国联通改造 Apache DolphinScheduler 资源中心,实现计费环境跨集群调用与数据脚本一站式访问
截止2022年,中国联通用户规模达到4.6亿,占据了全中国人口的30%,随着5G的推广普及,运营商IT系统普遍面临着海量用户.海量话单.多样化业务.组网模式等一系列变革的冲击. 当前,联通每天处理话单 ...
- Apache DolphinScheduler ASF 孵化器毕业一周年,汇报来了!
不知不觉,Apache DolphinScheduler 已经从 Apache 软件基金会(以下简称 ASF)孵化器毕业一年啦! 北京时间 2021 年 4 月 9 日,ASF 官方宣布 Apache ...
- 【Apache】的运营之道
1.“一个修修补补”的服务? 大家可能听说过 Apache 是一个双关语 “a patchy Web server”,意思为一个修修补补的 web 服务,即通过一系列的补丁做的服务.但是这并不是 Ap ...
- 15个具有高度影响力的Apache开源项目
自1999年创立以来,Apache软件基金会如今已成了众多重要的开源软件项目之家.其中成功的项目有Geronimo,有Tomcat,有Hadoop,有如今成了大数据王国关键车毂的分布式计算系统. 虽然 ...
随机推荐
- Linux curl支持http/https方法,Curl请求示例语法
Curl请求示例curl -X GET "http://<host:port>/api/1/test/get?test=<value>&app_id=< ...
- oracle数据库文件
oracle数据库重要的文件包括参数文件,控制文件,数据文件,临时文件,重做日志文件. 1 参数文件 oracle的参数文件可以设置数据库的名称,SGA和PGA的大小,控制文件的路径等系统参数.这些参 ...
- 使用AWS Glue进行 ETL 工作
数据湖 数据湖的产生是为了存储各种各样原始数据的大型仓库.这些数据根据需求,进行存取.处理.分析等.对于存储部分来说,开源版本常见的就是 hdfs.而各大云厂商也提供了各自的存储服务,如 Amazon ...
- uboot 修改代码 增加 环境变量
--- title: uboot修改代码增加环境变量 date: 2019-12-27 21:26:39 categories: tags: - uboot --- 以"tftp下载kern ...
- ajax过程?
1. 创建ajax对象var xhr = new XMLHttpRequest(); 2.告诉Ajax对象要向哪发送请求,以什么方式发送 //请求方式 请求地址xhr.open('get' ...
- 建立Model
直接使用Sequelize虽然可以,但是存在一些问题. 团队开发时,有人喜欢自己加timestamp: var Pet = sequelize.define('pet', { id: { type: ...
- vue项目的简单创建与插件下载
准备工作 安装node.js 安装node.js过程全部采用默认配置,一步一步next即可 检验node.js是否安装成功:在cmd命令行中输入node -v以及npm -v 通过cmd创建 安装vu ...
- MoneyPrinterPlus全面支持本地Ollama大模型
MoneyPrinterPlus现在支持批量混剪,一键AI生成视频,一键批量发布短视频这些功能了. 之前支持的大模型是常用的云厂商,比如OpenAI,Azure,Kimi,Qianfan,Baichu ...
- nginx负载均衡session共享解决方案
解决方案: 1.使用客户端的cookie作为存放登录信息的媒介 cookie是将用户登录信息存储在用户终端的数据载体,与session的最大区别就是,session是存储在服务器端的:所以这就很容易解 ...
- Linux安装 JDK (CentOS 7)
Linux安装 JDK 一.Linux安装软件的方式 第一种:二进制发布包安装: 软件已经针对具体平台编译打包发布,只要解压,修改配置即可 第二种: rpm安装 : 软件已经按照redhat的包管理规 ...