漫谈 Greenplum 开源背后的动机

 Greenplum是一家总部位于美国加利福尼亚州,为全球大型企业用户提供新型企业级数据仓库(EDW)、企业级数据云(EDC)和商务智能(BI)提供解决方案和咨询服务的公司,在全球已有:纳斯达克纽约证券交易所Skype. FOX,T-Mobile;中国已有:中信实业银行东方航空公司阿里巴巴华泰保险,中国远洋(Cosco),李宁公司等大型企业用户选择Greenplum的产品。
 
 

这几天最大的消息莫过于 Greenplum 的开源,年初开始 Pivotal 就宣布了 greenplum 的开源,经过大半年的翘首等待,终于在十月底在欧洲的 Postgres 大会宣布开源,并兑现在 Github 上开放代码(https://github.com/greenplum-db/gpdb ),社区的官网为 http://greenplum.org/, 其官方博客也有提到相关事项。代码是采用 Apache 许可,今天已经有社区的朋友尝鲜从社区取下代码,在 Greenplum 上测试了 tpch 的性能,虽然测试比较粗糙但是结果基本和商业版的一样,印证了之前 greenplum 将走向全开源的消息。虽然里面关键的新一代优化器 orca 还没有看到代码,但据消息这部分后续也会开出来,估计这个是其对这个最核心资产的一个谨慎的操作。

总体的印象来看,其采取开放的 Apache 许可,代码基本上无保留开源,这次的开源更大程度是公司层面的战略行为,而不是简单的市场推广的战术行为。

Greenplum 的开源,在我看来有几个驱动力。

首先是受其 cloud foundry 开源战略成功的驱动。pivotal在整个emc联邦的定位来说是偏中间件这一层,emc是存储,vmware是虚拟化,pivotal要搞定的是PaaS。而pivotal的业务上来说,要把云和大数据这两个支柱搞定,才能把emc联邦的疆域稳定下来。云这一层来说vmware已经是私有云的霸主,而剩下的上层PaaS这一层如果落入他人之手对其来说也是一个大威胁,所以PaaS这一层也是志在必得。鉴于当时已经在市场有很多对手,2011年的时候cloudfoundry启动是以开源的模式来去做,把IBM和HP拉上。这个战略取得了出人意料的巨大成功,现在CF几乎要变成了PaaS的事实标准,IBM也推出了基于CF的bluemix产品,而pivotal在今年发布的2014年的财报,极为惹眼的标题:破纪录的2014年,史上最快的开源产品销售增长( http://finance.yahoo.com/news/pivotal-cloud-foundry-reports-record-160000128.html )在短短的一年里,就获得4千万美金的软件销售收入,另外也获得了财富500强中的100个客户!这对于基础软件来说,基本是神话。说了这么多,无外乎就是给大家强调一下,整个pivotal在cloudfoudry的巨大成功下,对于开源的认识已经到了商业战略的层次,已经不需要去讨论要不要开源,开源已经成为杀手级的武器!在此背景下我们来去理解greenplum的开源才更容易理解。

其次,Pivotal 的大数据战场,需要新的战略调整。上面提到,除了云以外,Pivotal的战略重心是大数据,Pivotal除了有自己的hadoop发行版以外还有greenplum作为大数据最重要的资产。但是大数据整个市场都不是太理想,Hadoop发行版除了有Cloudera,Hortonworks,MapR这三个第三方发行版以外,还有Pivotal,IBM,Intel这些厂商本身的发行版,市场最突出的问题是碎片化(fragmented),Hadoop的门槛低,厂商林立,同质化严重,不仅仅难以溢价出售,传统大厂商靠溢价销售基础软件获取超额利益的路子开始行不通;更为重要的是越来越多的客户倾向于使用第三方独立的发行版,道理不难理解,用户更希望的是Linux生态里面有Redhat和SuSe这样的发行厂商,而不希望类似AIX或者是Windows Server这种由厂商控制的生态,这个更加加剧了厂商面临的困境。Intel由于其发行版的糟糕市场表现,开始陆续解散自己的Hadoop团队,国内的星环就是在这个背景下诞生,2014年Intel重金投资Cloudera 7.4亿美金取得18%的股权,Dell也投入Cloudera的阵营,HP、微软、Teradata则倾向于直接使用Hortonworks的发行版,HP还投资了Hortonworks。但是Cloudera的优势明显,营收是Hortonworks的将近一倍,Cloudera俨然有成为Hadoop生态的新的霸主的阵势,市场格局开始慢慢固化,Intel有可能是这场战役的赢家。在这样的市场格局里面,Pivotal的困境可想而知,HD的发行版肯定需要重新调整策略,所以Pivotal联合IBM、GE等15个弱势玩家, 在今年3月宣告成立ODP(Open Data Platform)组织,本质上是希望通过支持Hortonworks抗衡Cloudera,取得平衡。但是这个赌注的胜算并不明显,Cloudera的CEO甚至公开嘲讽ODP,说其出现本身就是Cloudera的一个胜利( https://gigaom.com/2015/03/03/cloudera-ceo-declares-victory-over-big-data-competition/   ),Greenplum的开源正是作为ODP的砝码而出现,Pivotal决定把HD发行版、Gemfire、HAWQ还有Greenplum开源,所以从这个角度我们看到,Greenplum的开源本身,就是Pivotal希望赢回这场战役的一个砝码,对其而言,越多人用越好,没有必要隐藏任何功能。

其实在 Greenplum 开源之前,MPP 数据库的日子也并不好过,也是市场碎片化,每个厂家也就区区几千万美金的营收,市场难以有大的突破,传统丰厚的 DW 市场也难以打入,Hadoop 生态又是以开源为主,甚至很多类似 Impala 这样的产品也在做其类似的功能,传统的打不开,新市场又难以全面打开,而且竞争重重,进退两难。而Greenplum十多年来的架构也无力进行大的调整。正是在这样的背景下,倒不如开源,盘活大局。下面这篇文章称其举动为 open sourcing code is the modern graceful way to retire an unprofitable product line (http://skylandtech.net/2015/02/24/thinking-about-the-pivotal-announcements/ )

Greenplum 的开源应该是相对比较激进和带有攻击性(aggressive)一着棋,成败难料,但对于整个生态会有比较大的影响。

漫谈 Greenplum 开源背后的动机的更多相关文章

  1. 开源大数据引擎:Greenplum 数据库架构分析

    Greenplum 数据库是最先进的分布式开源数据库技术,主要用来处理大规模的数据分析任务,包括数据仓库.商务智能(OLAP)和数据挖掘等.自2015年10月正式开源以来,受到国内外业内人士的广泛关注 ...

  2. 基于软件开源实践(FLOSS)论共产主义的可实现性

    好久没发博客,来个狠的,我不信挨踢界有人比我更蛋疼来研究这个. 在马克思提出共产主义100多百年后,软件开发领域中出现了一种特别的生产方式:开源(FLOSS:Free/Libre and Open S ...

  3. 转:从开源项目学习 C 语言基本的编码规则

    从开源项目学习 C 语言基本的编码规则 每个项目都有自己的风格指南:一组有关怎样为那个项目编码约定.一些经理选择基本的编码规则,另一些经理则更偏好非常高级的规则,对许多项目而言则没有特定的编码规则,项 ...

  4. 关于k8s这项大动作,预示着边缘计算迎来“开源”发展的新周期……

    在文章<最近在边缘计算领域,发生了一件足以载入物联网史册的大事…>我曾经提到Kubernetes(简称K8s)将从超大规模云计算环境,被带入到物联网边缘计算场景中. 事情有了新进展,从本周 ...

  5. 开源运动的"圣经"——《大教堂与集市》读书笔记

    作者:Eric S. Raymond 一.黑客圈简史 1.早期 (1)MIT 与 ITS "黑客"一词大约就起源于MIT的计算机文化. 从PDP-1时代开始,黑客文化的命运就和DE ...

  6. PostgreSQL和Greenplum、Npgsql

    PostgreSQL和Greenplum.Npgsql 想着要不要写,两个原因“懒”和“空”.其实懒和空也是有联系的,不是因为懒的写,而是因为对PostgreSQL和Npgsql的知识了解匮乏,也就懒 ...

  7. greenplum和postgresql

    想着要不要写,两个原因"懒"和"空".其实懒和空也是有联系的,不是因为懒的写,而是因为对PostgreSQL和Npgsql的知识了解匮乏,也就懒得写.好了,开头 ...

  8. Greenplum 数据库架构分析

    Greenplum 数据库是最先进的分布式开源数据库技术,主要用来处理大规模的数据分析任务,包括数据仓库.商务智能(OLAP)和数据挖掘等.自2015年10月正式开源以来,受到国内外业内人士的广泛关注 ...

  9. (转)聊聊Greenplum的那些事

    开卷有益——作者的话 有时候真的感叹人生岁月匆匆,特别是当一个IT人沉浸于某个技术领域十来年后,蓦然回首,总有说不出的万千感慨. 笔者有幸从04年就开始从事大规模数据计算的相关工作,08年作为Gree ...

随机推荐

  1. org.hibernate.MappingException: Unknown entity常见问题。回顾笔记,以前没记,现在补上,xiaochao写的蛮好的直接给转载了。

    转自http://www.blogjava.net/xiaochao/articles/hibernatetopic.html. 官方说明如下: Hibernate遵循EJB3.0实体bean的注解规 ...

  2. div使用jqueryui 源码 | gridview多个功能的源码

    div使用jqueryui 源码 | gridview多个功能的源码 一.gridview 选中行 改变颜色,双击选中 改变颜色 protected void gv1_SelectedIndexCha ...

  3. 20145227《Java程序设计》课程总结

    20145227<Java程序设计>课程总结 每周读书笔记链接汇总 20145227 <Java程序设计>第1周学习总结 20145227 <Java程序设计>第2 ...

  4. 20145227 《Java程序设计》第4周学习总结

    20145227 <Java程序设计>第4周学习总结 教材学习内容总结 第六章 继承与多态 6.1 何谓继承 1.继承共同行为 多个类中存在相同属性和行为时,将这些内容抽取到单独一个类中, ...

  5. ACM题目————装箱问题

    题目描述 有一个箱子容量为V(正整数,0<=V<=20000),同时有n个物品(0<n<=30),每个物品有一个体积(正整数). 要求n个物品中,任取若干个装入箱内,使箱子的剩 ...

  6. ZOJ 3860: - Find the Spy

    3860 - Find the Spy Time Limit:2000MS     Memory Limit:65536KB     64bit IO Format:%lld & %llu S ...

  7. laravel框架总结(二) -- blade模板引擎

    ## 1.基本用法 ##情形1 $name = laravel5 <div class="title"> {{$name}} {{$name}}</div> ...

  8. C#中另类自定义公式计算 字符串转换为计算公式,并得出计算结果

    [csharp] view plain copy print? //方法一 利用DataTable中的Compute方法 例如:1*2-(4/1)+2*4=6 , , , ); DataTable d ...

  9. grails-shiro权限认证

    一.引用shiro插件 //在BuildConfig的plugins下面添加 compile ":shiro:1.2.1" 二.引用新插件后要进行编译 //grails命令 com ...

  10. PHP 之 FastCGI 与 mod_php 详解

    背景 PHP最常用的方式是以模块的方式(mod_php)运行在Apache中,也是Apache运行PHP的默认方式:但在Nginx中,Nginx又使用的是PHP-FPM,但是PHP-FPM到底是个什么 ...