千呼万唤始出来,Meetup 直播终于来啦~

本次线上 Meetup 由 Apache Kylin 与 Apache Hudi 社区联合举办,将于 3 月 14 日晚进行直播,邀请到来自丁香园、腾讯、柯林布瑞以及 Kyligence 等公司的技术专家,为大家呈现 Kylin 与「由 Uber 开源的数据湖项目」Hudi 的精彩应用案例与实践。感兴趣的小伙伴可以直接拉到文末报名!

活动议程

19:00-19:05   开场

19:05-19:35   Talk 1:《丁香园日志量十倍增长引发的运维思考》

19:35-20:05   Talk 2:《使用 Hudi 构建下一代数据湖及其在医疗大数据的应用》

20:05-20:35   Talk 3:《基于 Hudi 和 Kylin 构建准实时高性能数据仓库》

20:35-21:00   Q&A

演讲嘉宾

丁香园日志量十倍增长引发的运维思考

周天鹏

丁香园大数据运维工程师

个人简介:花厂的一名平平无奇的运维,Apache Kylin Committer,“2019 最佳 Apache Kylin 社区贡献个人奖”获得者,主要负责 OLAP 平台的开发与维护。

演讲摘要:

如果突然一天在线系统的日志量比平时翻了 10 倍,并且恰巧使用了 ELK 这种主流的日志收集分析平台。在不扩容的情况下,Elasticsearch 的写入速率能不能跟得上?存储容量能不能盛得下?统计查询能不能不超时?如果不能,Kylin 3.0 的 Real-time Streaming(实时分析)了解一下?它或许是一种低成本替换 ELK 的极佳方案。

使用 Hudi 构建下一代数据湖及其在医疗大数据的应用

李少锋

Apache Hudi Committer & PPMC

个人简介:腾讯大数据开发工程师,从事大数据实时计算及数据湖分析平台研发,热衷于大数据开源技术。

黄靖

柯林布瑞大数据开发经理

个人简介:主要从事 Hadoop 生态医疗大数据产品的研发,实时计算平台建设。热衷于大数据相关技术的研究。

演讲摘要:

本次分享将会介绍 Hudi 在医疗大数据的实践和应用,介绍如何基于 Hudi 打造医疗场景下数据湖:

  1. 为什么要选择 Hudi

  2. 数万张表如何快速同步 Hudi

  3. Hudi 查询优化和视图的选择

基于 Hudi 和 Kylin 构建准实时高性能数据仓库

史少锋

Apache Kylin PMC Chair

个人简介:Kyligence 首席架构师,负责 Kyligence 解决方案及 Apache Kylin 社区发展。

刘永恒

Kyligence 解决方案工程师

个人简介:主要负责 Kyligence 业务方案和大数据平台相关方案的开发。

演讲摘要:

数据从业务库(TP)同步到分析库(AP)是一个繁琐的过程。为了减少对业务库的压力,数据同步通常采用 T+1 离线导出,或 CDC(binlog)流的方式;前者延迟长,后者在 Hadoop 上开销过大。要获得低延迟往往要借助 HBase/Kudu 这类高级存储,运维成本高,Hudi 的出现填补了空缺。本分享将介绍利用 Hudi 构建基于 HDFS/S3 的数据湖,并与 Kylin 结合实现端到端的准实时入库。目前 Kyligence Cloud 3 已支持 Hudi on S3 做为数据源,助力云上大数据快速分析,本次分享将结合 live demo 来展示此方案。

活动信息

直播时间:2020 年 3 月 14 日(周六)19:00-21:00

报名截止时间:3 月 13 日(周五)24:00

*仅限 500 人在线参与,现在就去报名吧~

↓扫描下方二维码报名↓

报名前请认真阅读下方报名提示,以免错过直播:

1. 本次活动的所有信息将通过邮件、活动微信群与您同步,务必正确填写邮箱及电话。

2. 活动中参与互动,将有机会 pick 随机掉落的精美社区周边以及书籍哦~

合作伙伴

直播 | Apache Kylin & Apache Hudi Meetup的更多相关文章

  1. 大数据分析神兽麒麟(Apache Kylin)

    1.Apache Kylin是什么? 在现在的大数据时代,越来越多的企业开始使用Hadoop管理数据,但是现有的业务分析工具(如Tableau,Microstrategy等)往往存在很大的局限,如难以 ...

  2. 大数据分析界的“神兽”Apache Kylin有多牛?【转】

    本文作者:李栋,来自Kyligence公司,也是Apache Kylin Committer & PMC member,在加入Kyligence之前曾就职于eBay.微软. 1.Apache ...

  3. Apache DolphinScheduler&TiDB联合Meetup | 聚焦开源生态发展下的应用开发能力

    在软件开发领域有一个流行的原则:Don't Repeat Yourself(DRY),翻译过来就是:不要重复造轮子.而开源项目最基本的目的,其实就是为了不让大家重复造轮子. 尤其是在大数据这样一个高速 ...

  4. 论语音社交视频直播平台与 Apache DolphinScheduler 的适配度有多高

    在 Apache DolphinScheduler& Apache ShenYu(Incubating) Meetup 上,YY 直播 软件工程师 袁丙泽 为我们分享了<YY直播基于Ap ...

  5. 《基于Apache Kylin构建大数据分析平台》

    Kyligence联合创始人兼CEO,Apache Kylin项目管理委员会主席(PMC Chair)韩卿 武汉市云升科技发展有限公司董事长,<智慧城市-大数据.物联网和云计算之应用>作者 ...

  6. Apache Kylin 部署之不完全指南

    1. 引言 Apache Kylin(麒麟)是由eBay开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据.底层存储用的是HBase,数据输入与cu ...

  7. 【转】使用Apache Kylin搭建企业级开源大数据分析平台

    http://www.thebigdata.cn/JieJueFangAn/30143.html 本篇文章整理自史少锋4月23日在『1024大数据技术峰会』上的分享实录:使用Apache Kylin搭 ...

  8. 【大数据安全】Apache Kylin 安全配置(Kerberos)

    1. 概述 本文首先会简单介绍Kylin的安装配置,然后介绍启用Kerberos的CDH集群中如何部署及使用Kylin. Apache Kylin™是一个开源的分布式分析引擎,提供Hadoop/Spa ...

  9. Apache kylin概览

    一.Apache kylin的核心概念 表(Table ):表定义在hive中,是数据立方体(Data cube)的数据源,在build cube 之前,必须同步在 kylin中. 模型(model) ...

随机推荐

  1. C++类的多态

    目录 一.静态多态 二.动态多态 三.虚函数 四.纯虚函数 五.C++ 接口(抽象类) 六.应用经验 七.版权声明 多态按字面的意思就是多种形态.当类之间存在层次结构,并且类之间是通过继承关联时,就可 ...

  2. c++第一章1.6

    测试已完成(bingo)     1 [单选题] 下面代码能够实现交换操作的函数有(       )   A. swap(int a,int b) { int t=a;a=b;b=t;} B. swa ...

  3. MySQL记录操作(多表查询)

    准备 建表与数据准备 #建表 create table department( id int, name varchar(20) ); create table employee( id int pr ...

  4. js 模拟滚动条

    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...

  5. airtest的使用(作用类似于appium)

    1.安装 下载免安装版本:http://airtest.netease.com/ 文档:http://airtest.netease.com/docs/docs_AirtestIDE-zh_CN/in ...

  6. Python习题集(一)

    每天一习题,提升Python不是问题!!有更简洁的写法请评论告知我! 题目 有一个数据list of dict如下 a = [ {"}, {"}, {"}, ] 写入到本 ...

  7. 深入分析mysql为什么不推荐使用uuid或者雪花id作为主键

    前言:在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建 ...

  8. Mol Cell Proteomics. | Elevated Hexokinase II Expression Confers Acquired Resistance to 4-Hydroxytamoxifen in Breast Cancer Cells(升高的己糖激酶II表达使得乳腺癌细胞获得对他莫昔芬的抗性)(解读人:黄旭蕾)

    文献名:Elevated Hexokinase II Expression Confers Acquired Resistance to 4-Hydroxytamoxifen in Breast Ca ...

  9. 【面试QA-基本模型】LSTM

    目录 为什么传统 CNN 适用于 CV 任务,RNN 适用于 NLP 任务 RNN 原理 LSTM 原理 GRU 原理 RNN BPTT LSTM 如何解决 RNN 的梯度消失问题 怎样增加 LSTM ...

  10. 《数据库优化》- MySQL视图

    一.什么是视图 视图,是基于一个表或多个表或视图的逻辑表,本身不包含数据,通过它可以对表里面的数据进行查询和修改,视图基于的表称为基表.视图是存储在数据字典里的一条select语句. 通俗地讲,视图就 ...