大数据开源商业化领域近日有一个爆炸性新闻,“Confluent 收购 Immerok”,字越少事越大,先给大家简单科普一下 Confluent 和 Immerok 这两家公司,Confluent 是掌控 Apache Kafka 社区的大数据开源商业化公司,Immerok 是 Apache Flink 创始人团队二次创业创办的公司。

说这件事之前又不得不提一下那家由 Apache Flink 创始人第一次创业创办的公司 Ververica,没错,正是前几年阿里巴巴花了 9000 万欧元收购的那家德国公司,但是被阿里收购后,Flink 创始人团队成员于22年初都陆续离职了。更魔幻的是这帮人离职后竟然直接创办了 Immerok 这家公司,而 Immerok 主要做的事情和 Ververica 无比相似,相当于 Flink 创始人团队另起炉灶和阿里对着干,这件事背后的隐情谁也不知道,但是吃瓜群众都有一个大大的问号 “没有竞业协议吗???”。阿里这一次无疑是哑巴吃黄莲有苦说不出,9000 万欧元最终买到的可能只有 Flink 社区的主导权。

上面说的这些事情是发生在22年初, Immerok 这家公司也是在那个时候成立的,然而仅仅不到一年的时间,这家初创公司就被 Confluent 收购了,这一操作让吃瓜群众再一次傻眼,不得不佩服 Apache Flink 创始人团队整活和整钱的能力,也不得不佩服阿里把一把好牌打得稀烂的能力。

话说回阿里收购 Ververica 之后, Flink 表面上好像发展得还不错,阿里自研的 Alink 合并到了主分支,国内越来越多公司用上了 Flink,阿里云的 Flink 生意看似也做的风声水起。但是这只是在国内小打小闹,Ververica 应该有更大的目标才对,他对标的应该是国外有大数据第一股之称的 Databricks(Apache Spark 背后的大数据商业公司,百亿美元市值),从近几年在国际上不温不火的表现来看,阿里这些年做的无疑是失败的。

另外说到 kafka 大家也很容易想到另外一家做流计算的公司 StreamNative(Apache Plusar 背后的商业公司),这起收购案也会给 StreamNative 带来一些压力,可能会加快流计算领域的布局,但是这并不算是致命的威胁,因为毕竟做 Flink 商业化且做的不错的公司可不止创始人团队那一家。

再说回 Confluent 收购 Immerok 的事情,猜测一下,大概率是做 Kafka和Flink的深度集成,两把流数据处理领域的利刃结合,不知道会擦出什么样的火花,可以预知的是动作肯定不会小,毕竟收编的可不是普通的 Flink PMC。如果有大动作的话,那和阿里的 Flink 团队对社区的发展方向势必会出现分歧,社区走向就会变得扑朔迷离。

虽然一般来说创始人团队对开源社区的话语权是最大的,但是对于 Flink 来说,毕竟之前和阿里做了一笔交易,名义上已经是把主导权卖给了阿里巴巴,创始人们个个也都赚得盆满钵满,现在再转过头来阿里对着干,在道德上和舆论上其实都很难占到上风。而且争夺 Apache Flink 社区掌控权这件事,无论成功与否都会对 Flink 社区造成了很大的内耗和伤害。

其实这种事件在开源领域并不少见,就比如大家熟悉的 facebook 主导开的源项目 Presto,是三位创始人(史称 presto 三巨头)在 facebook 工作时开源的,但是他们对 Presto 的发展方向并不满意,因为方向实际上是被 facebook 的需求所掌控的,所以最终他们三离职后创办了 Starburst 这家公司,关键是这家公司并不是做 Presto 的商业化,而是另起炉灶,从 Presto fork 出来一个分支,创建了 Trino 项目,以这种方式让 Presto 朝自己想要的方向发展。目前来看,虽然 star、fork 这些数量比不上 Presto,但是 Trino 的社区活跃度已经超过了 presto。

Trino 这个剧本,会不会被 Flink 创始人团队拿到,也许现在最担心这件事发生的就是阿里了,作为吃瓜群众也无法得知 Flink 创始人团队离职的原因是不是对目前阿里主导的社区发展方向感到失望,如果是的话,走上和trino类似的道路也不是不可能。

说实话社区的分裂对用户来说并不是一件好事,多了选择和学习的成本。对开源社区来说也不是一件好事,无法集中火力干好一件事。但是为了利益,这样的案例总是层出不穷,只希望能给后面的开源商业化公司提个醒,不要走上类似阿里这样的冤种大道。

Flink 创始人团队二次收购案!阿里恐成冤大头!的更多相关文章

  1. MariaDB强势席卷DB-Engines榜单后续,与阿里云达成全球独家战略合作

    2018年10月份,DB-Engines 发布了月全球数据库排名,排名前三的一如既往还是Oracle.MySQL.Microsoft SQL Server.排名是重要指标,同时增长率的重要性也同样备受 ...

  2. Android RecyclerView单击、长按事件:基于OnItemTouchListener +GestureDetector标准实现(二),封装抽取成通用工具类

     Android RecyclerView单击.长按事件:基于OnItemTouchListener +GestureDetector标准实现(二),封装抽取成通用工具类 我写的附录文章2,介绍了 ...

  3. MongoDB与阿里云达成战略合作,最新数据库独家上线阿里云!

    11月26日,开源数据库厂商MongoDB与阿里云在北京达成战略合作,作为合作的第一步,最新版MongoDB 4.2数据库产品正式上线阿里云平台. 目前阿里云成为全球唯一可提供最新版MongoDB服务 ...

  4. Flink学习(二)Flink中的时间

    摘自Apache Flink官网 最早的streaming 架构是storm的lambda架构 分为三个layer batch layer serving layer speed layer 一.在s ...

  5. Flink原理(二)——资源

    前言 本文主要是想简要说明Flink在集群部署.任务提交.任务运行过程中资源情况,若表述有误欢迎大伙留言分享,非常感谢! 一.集群部署阶段 集群部署这里指的是Flink standalone模式,因为 ...

  6. 马云专访二:点评阿里雅虎交易、BAT三家、互联网巨头与政府关系

    记者:我们不得不要说到你和雅虎之间的事情了.你知道,雅虎对整个互联网业的意义不只是一家公司,它有它象征的意义,重要的是,雅虎对阿里巴巴的意义更加非同寻常,当你最后决定用76亿美元从雅虎“赎身”的时候, ...

  7. Flink入门(二)——Flink架构介绍

    1.基本组件栈 了解Spark的朋友会发现Flink的架构和Spark是非常类似的,在整个软件架构体系中,同样遵循着分层的架构设计理念,在降低系统耦合度的同时,也为上层用户构建Flink应用提供了丰富 ...

  8. Flink使用(二)——Flink集群资源规划

    前言 本文主要译自Flink Forward 2017的柏林站中Robert Metzger的有关集群规划的How to size your flink cluster一文.该文中主要是考虑网络资源, ...

  9. Flink架构(二)- Flink中的数据传输

    2. Flink中的数据传输 在一个运行的application中,它的tasks在持续交换数据.TaskManager负责做数据传输.TaskManager的网络组件首先从缓冲buffer中收集re ...

  10. Linux网络安全篇,配置Yum源(二),阿里Yum源

    官网教程: https://opsx.alibaba.com/mirror 1.下载配置文件到 /etc/yum.repos.d 目录 wget -O /etc/yum.repos.d/CentOS- ...

随机推荐

  1. Dubbo 02: 直连式

    直连式 需要用到两个相互独立的maven的web项目 项目1:o1-link-userservice-provider 作为服务的提供者 项目2:o2-link-consumer 作为使用服务的消费者 ...

  2. NOI2017蚯蚓排队

    原题链接 发现 k<=50 ,在插入和删除时最多会影响不超过 k2 个串,用链表实现插入和删除,然后只需用哈希表维护每个长度不超过k的串的出现次数,哈希的话可以先用比较大的范围的值处理冲突,再映 ...

  3. JS复制粘贴效果

    话不多说.直接上代码 HTML: 1 <div> 2 老师入会密码:<input type="text" id="tPass"> < ...

  4. java中的垃圾回收算法与垃圾回收器

    常用的垃圾回收算法 标记-清除 标记清除算法是一种非移动式的回收算法,分为标记 清除 2个阶段,简而言之就是先标记出需要回收的对象,标记完成后再回收掉所有标记的内存对象,如下图 可见回收后图中被标记的 ...

  5. DQL语句排序与分组

    DQL语句排序与分组 一.DQL-排序 排序是计算机内经常进行的一种操作,其目的是将一组"无序"的记录序列调整为"有序"的记录序列.分内部排序和外部排序,若整个 ...

  6. Python基础之函数:4、二分法、三元表达式、生成/推导式、匿名函数、内置函数

    目录 一.算法简介之二分法 1.什么是算法 2.算法的应用场景 3.二分法 二.三元表达式 1.简介及用法 三.各种生成式 1.列表生成式 2.字典生成式 3.集合生成式 四.匿名函数 五.常见内置函 ...

  7. ES6 学习笔记(二)解构赋值

    一.数组的解构赋值 1.基本用法 ES6允许按照一定模式从数组和对象中提取值,然后对变量进行赋值,该操作即为解构 如: let [a,b,c]=[1,2,3]; console.log(a,b,c) ...

  8. 解决pip下载速度慢问题

    解决pip下载速度慢的问题 痛点:当我们pip 安装第三方库的时候,由于是访问的国外地址,所以会出现下载很慢!干等..... 解决方案: # 1.在C盘目录-->Users-->用户--& ...

  9. 关于Intent.setDataAndType参数问题

    关于Intent.setDataAndType参数问题 install取设置属于和类型,数据就是获取到的uri,更具文件类型不同,type参数也不相同,具体参考下表 {后缀名,MIME类型} ​ {& ...

  10. vcenter的虚拟机开机进入bios