在9月16日召开的“2022 OSCAR开源产业大会”上,中国信息通信研究院发布了一系列开源研究成果和开源表彰,网易数帆发起的开源项目Apache Kyuubi荣获“OSCAR尖峰开源项目及开源社区”,有数大数据基础平台NDH荣获“OSCAR尖峰开源技术创新(二次开发)”。

此外,网易数帆发起的云原生开源项目Slime和Curve分别获得了“可信开源社区共同体(TWOS)”和“TWOS 银河计划成员”的授牌。

“OSCAR开源尖峰案例”评选旨在为开源产业发展立标杆、树典范,已开展多年,可谓中国开源领域的奥斯卡,可信开源社区则致力于推动开源社区发展和落地应用。网易数帆获得权威评选的认可,再次证明了公司构建的开放式大数据架构的先进性,及践行“架构开放,内核开源”理念的决心。

Apache Kyuubi:社区成熟,毕业可期

Kyuubi作为一个封装SparkSQL的服务诞生,将多租户、高可用和分布式等企业级特性引入开源大数据的世界,因其实用性受到了社区用户的关注。2021年6月,Kyuubi项目进入Apache软件基金会孵化,并在Apache Way的指引下实现了更快的发展速度。依托本身的架构设计,Apache Kyuubi快速迭代,在Spark之外完成了Flink 、Trino(Presto)、Hive 等主流计算框架的支持,成为一个面向Serverless SQL on Lakehouse的服务,支持更加丰富的大数据场景应用,并被网易、阿里云、腾讯云、小米、华泰证券、广发证券、丁香园、eBay、T3出行、携程、爱奇艺、哔哩哔哩、womply、Houzz、kt NexR等国内外近百家企业采用。

网易数帆的开放式大数据架构中,Apache Kyuubi被视为统一SQL网关,用以屏蔽整个体系中不同存储、计算/查询引擎的差异,为数据中台提供支撑。

Apache Kyuubi的演进得益于社区的成熟,经过不到15个月的孵化,社区已经拥有93位代码贡献者,其中来自网易外部的贡献者占比超过了80%,充分体现了社区驱动的力量。最近,Apache Kyuubi被中国开源软件推进联盟主编的《2022中国开源发展蓝皮书》和InfoQ研究院编撰的《中国开源发展研究分析2022》列为中国开源大数据基础设施的代表。而今,在整个社区坚持不懈的努力下,Kyuubi从Apache基金会毕业可期,成为基金会顶级项目的目标不再遥远。

对于Apache Kyuubi的项目表现和社区发展态势,OSCAR评委专家均给予高度认可。

NDH:我左Spark,右Impala,Kyuubi在上面

作为一款企业级大数据基础平台,网易数帆有数大数据基础平台NDH的核心特点,一是兼容并增强Hadoop体系组件,二是完全自主掌握核心代码,这对于企业从原有大数据平台平滑迁移、满足自主可控要求来说都很重要。更为重要的是,有数大数据基础平台NDH基于最新开源技术打造,在业务支撑能力及性能上有更加出色的表现。

有数大数据基础平台NDH内置多种存储计算引擎,并在Hadoop、Spark、Impala等多个核心组件做了功能及性能增强(例如在Impala上实现虚拟数仓特性),还新增了智能运维和任务治理能力,支持企业级安全管控。这些能力的增强正是大规模生产落地的结晶,获得了评委专家的肯定。

有数大数据基础平台NDH原本作为网易数帆数据中台的底座提供,因市场需求,于今年6月作为单独的产品发布,此举也曾引发业界热议——网易数帆为何进军这门“不好的生意”。然而,这款产品在Impala和Kyuubi方面的积累和优势让从业者印象深刻。目前,有数大数据基础平台NDH已应用于银行、证券、流通、制造等行业三百多家企业客户生产环境。

Slime和Curve:持续完善开源云原生基础设施

Apache Kyuubi和有数大数据基础平台NDH是网易数帆开放式大数据架构的开源项目和商业产品代表,Slime和Curve则是网易数帆开源云原生基础设施的两大支柱,分别填补了服务网格智能管理和国产高性能云原生存储的空白。因其生态定位、架构设计的独特性以及社区发展前景,Slime社区和Curve社区分别受邀成为可信开源社区共同体(TWOS)成员和TWOS 银河计划成员,针对项目质量、社区发展、商业模式等话题加强开源社区之间的交流协作,不仅完善开源云原生基础设施生态,也助推国内开源产业健康、快速发展。

未来,网易数帆将继续秉承开放式思维拥抱开源,以扎实的产品实力和先进的技术实力为后盾,团结社区合作伙伴,持续为开源生态建设贡献力量。

构筑开放式大数据架构,Apache Kyuubi和NDH荣登开源OSCAR的更多相关文章

  1. 大数据架构-使用HBase和Solr将存储与索引放在不同的机器上

    大数据架构-使用HBase和Solr将存储与索引放在不同的机器上 摘要:HBase可以通过协处理器Coprocessor的方式向Solr发出请求,Solr对于接收到的数据可以做相关的同步:增.删.改索 ...

  2. 后Hadoop时代的大数据架构(转)

    原文:http://zhuanlan.zhihu.com/donglaoshi/19962491 作者: 董飞       提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年 ...

  3. 大数据架构师基础:hadoop家族,Cloudera产品系列等各种技术

    大数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm,impala,让我们都反映不过来.为了能够更好的架构大数据项目,这里整理一下,供技术人员,项目经理,架构师选 ...

  4. 后Hadoop时代的大数据架构

    提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多东西发生了变化,版本也从0.x进化到目前的2.6版本.我把2012年后定义成后Hadoop平台时代,这不是说不 ...

  5. 一篇了解大数据架构及Hadoop生态圈

    一篇了解大数据架构及Hadoop生态圈 阅读建议,有一定基础的阅读顺序为1,2,3,4节,没有基础的阅读顺序为2,3,4,1节. 第一节 集群规划 大数据集群规划(以CDH集群为例),参考链接: ht ...

  6. 大数据架构师必读的NoSQL建模技术

    大数据架构师必读的NoSQL建模技术 从数据建模的角度对NoSQL家族系统做了比较简单的比较,并简要介绍几种常见建模技术. 1.前言 为了适应大数据应用场景的要求,Hadoop以及NoSQL等与传统企 ...

  7. 阿里巴巴飞天大数据架构体系与Hadoop生态系统

    很多人问阿里的飞天大数据平台.云梯2.MaxCompute.实时计算到底是什么,和自建Hadoop平台有什么区别. 先说Hadoop 什么是Hadoop? Hadoop是一个开源.高可靠.可扩展的分布 ...

  8. 决战大数据之三-Apache ZooKeeper Standalone及复制模式安装及测试

    决战大数据之三-Apache ZooKeeper Standalone及复制模式安装及测试 [TOC] Apache ZooKeeper 单机模式安装 创建hadoop用户&赋予sudo权限, ...

  9. WOT干货大放送:大数据架构发展趋势及探索实践分享

      WOT大数据处理技术分会场,PingCAP CTO黄东旭.易观智库CTO郭炜.Mob开发者服务平台技术副总监林荣波.宜信技术研发中心高级架构师王东及商助科技(99Click)顾问总监郑泉五位讲师, ...

  10. 学习《深度学习与计算机视觉算法原理框架应用》《大数据架构详解从数据获取到深度学习》PDF代码

    <深度学习与计算机视觉 算法原理.框架应用>全书共13章,分为2篇,第1篇基础知识,第2篇实例精讲.用通俗易懂的文字表达公式背后的原理,实例部分提供了一些工具,很实用. <大数据架构 ...

随机推荐

  1. 智能控制 | AIRIOT智慧楼宇管理解决方案

    许多行业客户在智慧楼宇的建设中主要面临运营管理低效,楼宇内部各个系统相互独立,不仅管理操作复杂,而且各系统间的数据无法分享,无法支撑大数据分析.此外,由于楼宇管理系统的低效,50%的建筑能耗是被浪费的 ...

  2. go高并发之路——缓存击穿

    缓存击穿,Redis中的某个热点key不存在或者过期,但是此时有大量的用户访问该key.比如xxx直播间优惠券抢购.xxx商品活动,这时候大量用户会在某个时间点一同访问该热点事件.但是可能由于某种原因 ...

  3. 【C# mvc5】使用mvc5 +bootstrap+EF6搭建一个权限管理系统的心得体会

    使用mvc5的体会,是 业务代码都可以独立分层,比如搭配多层架构,通过controller控制器传递需要渲染的列表,按钮.接受前端返回的实体模型等.总之我觉得要在前端渲染的数据可以写在controll ...

  4. MLP实现波士顿房屋价格回归任务

    1. 数据集 波士顿房屋价格.csv文件,文件中的数据有可能不完整,部分数据如下: CRIM, ZN ,INDUS ,CHAS,NOX,RM,AGE,DIS,RAD,TAX,PTRATIO,LSTAT ...

  5. django设置中文和上海时间

    在settings.py配置文件中进行配置: # 设置为中文 LANGUAGE_CODE = 'zh-hans' # 设置 "亚洲/上海" 时区 TIME_ZONE = 'Asia ...

  6. .net c# 文件分片/断点续传之下载--客户端

    断点续传客户端实现主要参考了以下文章: https://blog.csdn.net/binyao02123202/article/details/76599949 客户端实现续传的主要是一下几点 1. ...

  7. 一款功能强大的Python工具,一键打包神器,一次编写、多平台运行!

    1.项目介绍 Briefcase是一个功能强大的工具,主要用于将Python项目转化为多种平台的独立本地应用.它支持多种安装格式,使得Python项目能够轻松打包并部署到不同的操作系统和设备上,如ma ...

  8. 01.Alpine编译glibc

    概要 本文档采用glibc2.28版本作为示例,模拟内网环境无法访问github等开源社区 为精简docker容器镜像,采用Alpine镜像,需要手动编译glibc源代码 制作编译好的glibc二进制 ...

  9. Qt-udp通信

    1  简介 参考视频:https://www.bilibili.com/video/BV1XW411x7NU?p=61 说明:UDP是面向无连接的,客户端并不与服务器不建立连接,直接向服务器发送数据, ...

  10. docker综合应用

    1.容器资源限制 官网文档 https://docs.docker.com/config/containers/resource_constraints/ 2.docker内存限制 -m或者--mem ...