2021 年 12 月 9 日,SeaTunnel (原名 Waterdrop) 成功加入 Apache 孵化器,进入孵化器后,SeaTunnel 社区花费了大量时间来梳理整个项目的外部依赖以确保整个项目的合规性,终于在贡献者们四个月的努力下,社区于 2022 年 3 月 18 日正式发布了首个 Apache 版本,该版本一次性通过 Apache 孵化器严苛的 2 轮投票审查,最大程度地保证了 SeaTunnel 软件 License 的合规性.同时这意味着 2.1.0 版本,是经过 SeaTu…
1. 介绍 经过Apache Hudi项目委员会讨论及投票,向Udit Mehrotra.Gary Li.Raymond Xu.Pratyaksh Sharma 4人发出Committer邀请,4人均已接受邀请并顺利成为Committer,也使得Apache Hudi Committer成员在不断发展壮大. Udit Mehrotra是来自AWS EMR团队的一员,在去年9/10月份开始参与Apache Hudi社区,帮助Apache Hudi集成至EMR中,将Apache Hudi引入AWS生…
1. 介绍 经过Apache Hudi项目委员会讨论及投票,向WangXiangHu和LiWei 2人发出Committer邀请,2人均已接受邀请并顺利成为Committer,也使得Apache Hudi Committer成员在不断发展壮大. Wang XiangHu参与Apache Hudi社区贡献已经超过1年时间,完成了Apache Hudi和Apache Spark的解耦工作,并且实现了Flink写Hudi的第一个版本,同时也实现了Commit回调机制,在每次Commit完成后发送HTT…
近日,SphereEx 商业公司在中国红杉种子基金及初心资本助力下,已完成公司及团队组建.各大媒体平台及公众号已相继报道,并抢占新闻头条.作为以 Apache ShardingSphere 核心团队组建.以开源技术为驱动的商业公司,SphereEx 与 ShardingSphere 社区关系如何?ShardingSphere 未来发展规划如何?相信上述问题,是很多 ShardingSphere 社区成员关注的问题.本文通过采访两位 Apache ShardingSphere 项目管理委员会成员,…
背景 本文的主人翁是 2 次飞机参会现场交流,四天研究就把 DolphinScheduler 用上生产的来自车联网行业的大数据 boy - 黄立同学.怎么样,听起来是不是有点 crazy?下面就来看看黄同学艺高人胆大的开源故事. 主人翁:黄立,长安汽车 - 云平台开发部 - 大数据工程师,负责车联网数据基础平台建设工作,DolphinScheduler Committer.目前专注于物联网数据存储和计算领域. 我参与到 DS 社区应该刚好一年,是非常典型的从开源用户到了解社区最后参与社区的路线.…
我与DolphinScheduler社区的故事 Apache DolphinScheduler 是一个开源的分布式去中心化.易扩展的可视化DAG大数据调度系统. 于2017年在易观数科立项,2019年3月开源,于2019年8月29日通过Apache基金会投票正式成为Apache孵化器项目.社区发展非常迅速,目前已有 400+ 公司在生产上使用,代码+文档贡献者近200位,社区用户4000 +人. 主人翁简介 姓名:黄立 长安汽车-云平台开发部-大数据工程师,负责车联网数据基础平台建设工作,Dol…
导读: 随着全球数据量的不断增长,越来越多的业务需要支撑高并发.高可用.可扩展.以及海量的数据存储,在这种情况下,适应各种场景的数据存储技术也不断的产生和发展.与此同时,各种数据库之间的同步与转化的需求也不断增多,数据集成成为大数据领域的热门方向,于是SeaTunnel应运而生.SeaTunnel是一个分布式.高性能.易扩展.易使用.用于海量数据(支持实时流式和离线批处理)同步和转化的数据集成平台,架构于Apache Spark和Apache Flink之上.本文主要介绍SeaTunnel 1.…
关于 Apache Pulsar Apache Pulsar 是 Apache 软件基金会顶级项目,是下一代云原生分布式消息流平台,集消息.存储.轻量化函数式计算为一体,采用计算与存储分离架构设计,支持多租户.持久化存储.多机房跨区域数据复制,具有强一致性.高吞吐.低延时及高可扩展性等流数据存储特性. 导语 各位小伙伴们,Pulsar 社区周报来啦! 本周 Pulsar 社区周报,为大家呈现 Pulsar client.broker 等内容,帮助社区小伙伴们掌握 Pulsar 项目及社区每周进展…
关于 Apache Pulsar Apache Pulsar 是 Apache 软件基金会顶级项目,是下一代云原生分布式消息流平台,集消息.存储.轻量化函数式计算为一体,采用计算与存储分离架构设计,支持多租户.持久化存储.多机房跨区域数据复制,具有强一致性.高吞吐.低延时及高可扩展性等流数据存储特性. 导语 各位小伙伴们,Pulsar 社区周报来啦!每周 Pulsar 社区周报,为大家呈现 Pulsar 客户端.broker.安全.Pulsar IO.社区活动等内容,帮助社区小伙伴们掌握 Pul…
DolphinScheduler是什么? Apache DolphinScheduler 是一个分布式.易扩展并带有强大的可视化界面的大数据工作流调度系统. 2021 年 03 月 18 日正式成为 Apache 顶级项目,是首个由国人主导并贡献到 Apache 基金会的大数据工作流领域的顶级项目. DolphinScheduler 致力于在数据工作流编排中 "解决复杂的大数据任务依赖及触发关系,让各种任务开箱即用".截止 2020 年 10 月,已有 400+ 公司在生产上使用. 我…