恭喜!Apache Hudi社区新晋多位Committer
1. 介绍
经过Apache Hudi项目委员会讨论及投票,向Udit Mehrotra、Gary Li、Raymond Xu、Pratyaksh Sharma 4人发出Committer邀请,4人均已接受邀请并顺利成为Committer,也使得Apache Hudi Committer成员在不断发展壮大。
Udit Mehrotra是来自AWS EMR团队的一员,在去年9/10月份开始参与Apache Hudi社区,帮助Apache Hudi集成至EMR中,将Apache Hudi引入AWS生态,其主要参与了RFC-12(高效迁移Parquet表至Hudi)中Hive/Spark的集成部分,同时还帮助社区用户解决关于AWS的各种各样问题;
Gray Li成为Committer的路径很值得推广,其早期作为Apache Hudi的用户,然后慢慢参与社区,成为一名优秀的Contributor,贡献了不少有挑战性的特性(如Impala集成Hudi,Spark DataSource支持MOR表查询等),积极帮忙Review PR和RFC,同时在微信群、Slack、邮件列表中积极回答用户问题。
Raymond Xu在微信群、Slack、邮件列表中持续回答用户问题,也改善了很多有价值有意义的测试/工具,贡献了大量代码,在Slack中有不少用户非常感谢Raymond的帮助。
Pratyaksh Sharma成为Committer的路径也很典型,user -> contributor -> committer。Pratyaksh对Hudi项目的发展也发挥了重要作用,在过去一年持续改善DeltaStreamer工具并修复了很多bug。
2. 社区
Apache Hudi社区在不断发展壮大,微信群/社区Slack/邮件列表非常活跃,讨论也非常开放,随着Hudi被越来越多公司熟知和使用,也吸引全球越来越多的小伙伴参与到社区中,其中来自国内开发者的声音越来越大,也欢迎一起更多国内小伙伴一起参与社区,让你的代码创造影响力。
3. 如何参与
如果你还不了解如何参与Hudi社区,可参考如下两篇文章:
持续参与社区贡献,如特性开发、bugfix、Code Review、回答用户问题、积极参与讨论等,Committer便水到渠成,行动起来,下一个Committer可能就是你。
4. 最后
再次恭喜Udit Mehrotra、Gary Li、Raymond Xu、Pratyaksh Sharma 4 位新晋Committer,一起打造更好的数据湖框架。
Apache Hudi项目github地址:https://github.com/apache/hudi,欢迎fork & star
恭喜!Apache Hudi社区新晋多位Committer的更多相关文章
- 恭喜!Apache Hudi社区新晋两位Committer
1. 介绍 经过Apache Hudi项目委员会讨论及投票,向WangXiangHu和LiWei 2人发出Committer邀请,2人均已接受邀请并顺利成为Committer,也使得Apache Hu ...
- 基于Apache Hudi构建数据湖的典型应用场景介绍
1. 传统数据湖存在的问题与挑战 传统数据湖解决方案中,常用Hive来构建T+1级别的数据仓库,通过HDFS存储实现海量数据的存储与水平扩容,通过Hive实现元数据的管理以及数据操作的SQL化.虽然能 ...
- Apache Hudi C位!云计算一哥AWS EMR 2020年度回顾
1. 概述 成千上万的客户在Amazon EMR上使用Apache Spark,Apache Hive,Apache HBase,Apache Flink,Apache Hudi和Presto运行大规 ...
- 使用Amazon EMR和Apache Hudi在S3上插入,更新,删除数据
将数据存储在Amazon S3中可带来很多好处,包括规模.可靠性.成本效率等方面.最重要的是,你可以利用Amazon EMR中的Apache Spark,Hive和Presto之类的开源工具来处理和分 ...
- Apache Hudi 0.5.1版本重磅发布
历经大约3个月时间,Apache Hudi 社区终于发布了0.5.1版本,这是Apache Hudi发布的第二个Apache版本,该版本中一些关键点如下 版本升级 将Spark版本从2.1.0升级到2 ...
- 官宣!ASF官方正式宣布Apache Hudi成为顶级项目
马萨诸塞州韦克菲尔德(Wakefield,MA)- 2020年6月 - Apache软件基金会(ASF).350多个开源项目和全职开发人员.管理人员和孵化器宣布:Apache Hudi正式成为Apac ...
- Uber基于Apache Hudi构建PB级数据湖实践
1. 引言 从确保准确预计到达时间到预测最佳交通路线,在Uber平台上提供安全.无缝的运输和交付体验需要可靠.高性能的大规模数据存储和分析.2016年,Uber开发了增量处理框架Apache Hudi ...
- Apache Hudi助力nClouds加速数据交付
1. 概述 在nClouds上,当客户的业务决策取决于对近实时数据的访问时,客户通常会向我们寻求有关数据和分析平台的解决方案.但随着每天创建和收集的数据量都在增加,这使得使用传统技术进行数据分析成为一 ...
- Apache Hudi 0.8.0版本重磅发布
1. 重点特性 1.1 Flink集成 自从Hudi 0.7.0版本支持Flink写入后,Hudi社区又进一步完善了Flink和Hudi的集成.包括重新设计性能更好.扩展性更好.基于Flink状态索引 ...
随机推荐
- 一、常用的Dos命令
# 查看目录下所有文件 dir # 切换目录 cd cd .. //返回上一级 # 清理屏幕 cls # 查询电脑ip地址 ipconfig # 退出终端 exit # 创建文件夹 md test # ...
- Windows下 Navicat Premium 15安装教程(图文,含注册)
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 本文链接:https://www.cnblogs.com/zhangzhicheng1996/ ...
- day12 异常 模块 单例
1.异常 处理 在程序执行过程中 ,发生,影响程序的正常运行 在python中 异常就是一个错误 try .... except....捕获异常 try 用来检测t ...
- 【POJ3071】Football - 状态压缩+期望 DP
Description Consider a single-elimination football tournament involving 2n teams, denoted 1, 2, …, 2 ...
- akka-typed(10) - event-sourcing, CQRS实战
在前面的的讨论里已经介绍了CQRS读写分离模式的一些原理和在akka-typed应用中的实现方式.通过一段时间akka-typed的具体使用对一些经典akka应用的迁移升级,感觉最深的是EvenSou ...
- 转行做程序员,培训or自学?过来人亲身经历良心分享
大家好,我是良许. 熟悉我的朋友应该知道我是学机械出身的,但是毕业后就自学转行成了一名 Linux 应用开发工程师了.我之前也做了几个跟转行相关的视频,有兴趣的小伙伴可以去看看. 在本文里,我将给大家 ...
- SparkStreaming-DStream(Discretized Stream)
DStream(Discretized Stream)离散流 ◆ 和Spark基于RDD的概念很相似,Spark Streaming使用离散流 (discretized stream)作为抽象表示,叫 ...
- 第1章 RDD概念 弹性分布式数据集
第1章 RDD概念 弹性分布式数据集 1.1 RDD为什么会产生 RDD是Spark的基石,是实现Spark数据处理的核心抽象.那么RDD为什么会产生呢? Hadoop的MapReduce是一种基于 ...
- 详解Python中的__init__和__new__
转载:https://my.oschina.net/liuyuantao/blog/747164 1.__init__ 方法是什么? 使用Python写过面向对象的代码的同学,可能对 __init__ ...
- 点击按钮出现时间javascrip代码
<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8" ...